Skip to main content

Full text of "ذكاء الأعمال والتحليلات♠ وعلم البيانات♦"

See other formats




ا 







ذكاء الأعمال, 
والتحليلات, 


وعلم البيانات 
SEA‏ 





rT O 
دورسون ديلن‎ ٠ 
إفرايع توربان‎ ٠ 


د. محمد بن عايض القرني N‏ 


راجع الترجمة 
د. حمود بن ظافر الدوسري 








لا للتطبيع .. الحرية لفلسطين .. لا للتطبيع .. الحرية لفلسطين 


بسم الله الرحمن الرحيم 


E 3‏ 
ذكاء الأعمال, 
والتحليلات, 
وعلم البيانات 
منظور إداري 





راميش شاردا 
دورسون ديلن 
إفرايم توربان 
ترجمة 
د. محمد بن عايض القرني 
راجع الترجمة 
د. حمود بن ظافر الدوسري 
١ھ‏ - ۳۰۲۰م 


(€) معهد الإدارة العامة ١٤٤١ه‏ 
فهرسة مكتبة الملك فهد الوطنية أثناء النشر. 


شاردا» رامیش 
ذكاء الأعمال والتحليلات وعلم البيانات: منظور إداري. 
/ راميش شاردا ؛ دورسون ديلن ؛ إفرايم توربان ؛ 
محمد بن عايض القرني. - الرياضء 55١‏ ١ه‏ 
YE x Wt je VA‏ سم. 
ردمك: ۹۷۸-1۰۳-۸۲۷71-۲۳-١‏ 
-١‏ نظم المعلومات الإدارية -١‏ إدارة الأعمال - 
معالجة البيانات أ. ديلن» دورسون (مؤلف مشارك) 
ب. توربان» إفرايم (مؤلف مشارك)ء € القرنيء 
محمد بن عايض (مترجم) د. العنوان 


E4 10۸,۰۲۸0 دیوي:‎ 


٠٤٤١/۹۳۱۹ رقم الإیداع:‎ 
SVA-3- Y-AYV3-YY-0 :el a3; 





Business Intelligence, Analytics, and Data Science: 


A Managerial Perspective 


Ramesh Sharda 
Dursun Delen 


And Efraim Turban 


موجز تمهيدي = 





نبذة عن المؤلفين ...... 





الفصل الأول: نظرة عامة على ذكاء الأعمالء والتحليلات» وعلم البيانات ..... هلا 


الفصل الثاني: التحليلات الوصفية :)١(‏ طبيعة البيانات: النمذجة الإحصائية, 
تصوير البيانات .... 








الفصل الثالث: التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البیانات .. ۲۲۱ 
الفصل الرابع: التحليلات التنبؤية :)١(‏ عملية وطرق وخوارزميات التنقيب في البيانات. YYo‏ 


Plug caslia yali Edes الفضل. الخامس:" التحليئلات القؤية'(9):‎ 





الفصل السادس: التحليلات التوجيهية: التحسين واطمحاكاة ... 





الفصل السابع: مفاهيم وأدوات البيانات الضخمة 





الفصل الثامن: الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








الموضوع 
نبذة عن المؤلفين 
الفصل الأول: نظرة عامة على ذكاء الأعمالء والتحليلات» وعلم البيانات ee‏ 
1-١‏ مقال افتتاحي: التحليلات الرياضية - حدود مثيرة لتعنّم وفهم تطبيقات 
التحليلات . 





٠-١‏ بيئات الأعمال المتغيرة والاحتياجات المتطورة لدعم القرار والتحليلات سسب 


١‏ تطور دعم القرار المحوسب لعلم البيانات / التخليلات س 
٤-١‏ إطار عمل ذكاء الأعمال ....... 





حالة عملية :1-١‏ شركة 58616 تساعد عملاءها من خلال لوحات المعلومات 
والتحليلات .. 





استعمال الوسائط المتعددة في ذكاء الأعمال 





0-١‏ نظرة عامة على التحليلات 





حالة عملية :!!-١‏ شركة سيلفاريس (51172515) توسّع أعمالها باستخدام التحليل «doll‏ 
وإمكانياتإعذاةاالتقازير'الفورينة .... 





حالة عملية JI (Siemens) («iaa 45: Y-V‏ التكلفة باستخدام تصوير البيانات.. 


à 2b JI cLoLayl ie ae 





حالة عملية :0-١‏ شركة ستيل بار (831 5]66[1) المتخصصة تستخده التحليلات لتحديد 
تواريخ تنفيذ التزاماتها وفقاً للموارد المتاحة 
1-١‏ أمثلة على التحليلات في مجالات ا مختارة ....... 








ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


YA 


£Y 


£1 


5 


o 


oV 


01 


w 


1 


"^ 


















































الموضوع الصفحة 

١-/ا‏ مقدمة موجزة لتحليلات البيانات الضخمة Ww‏ 
حالة عملية :1-١‏ شركة 20186 062167 للطاقة تستخدم التحليلات الفورية للبيانات 
الضخمة لتحسين خدمة العملاء .... .^ 
4-١‏ نظرة عامة على النظام البيئي للتحليلات ........ M‏ 
9-١‏ خطة الكتاب ... qo‏ 
٠١-١‏ مواردء وروابطء واتصال شبكة جامعة تيراداتا ... ۹۷ 
الفصل الثاني: التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائيةء تصوير 

10 
١۲‏ مقال إفتتاحي: قيام ال SiriusXM‏ بجذب وإشراك جيل جديد من 
مستخدمي الراديو باستخدام التسويق المبني على البيانات .... Mn‏ 
۲-۲ طبيعة البيانات .... M‏ 

wI 
11 n JUI حالة عملية ؟-1: شركة أجهزة طبية تضمن جودة المنتج مع توفير‎ 
WE فن وعلم معالجة البيانات‎ ٤-۲ 
حالة عملية ؟-؟: تحسين الاحتفاظ بالطلاب باستخدام التحليلات المعتمدة على‎ 
wa .. البيانات‎ 
wv ..... ؟-0 النمذجة الإحصائية لتحليلات الأعمال‎ 
حالة عملية ۳-۲: مدينة كاري تستخدم التحليلات لتحليل البيانات من أجهزة‎ 
101 الاستشعار وتقييم الطلب والكشف عن المشكلات‎ 
lot نمذجة الانحدار للإحصاءات الاستدلالية‎ 5-7 
vw .... 71044 توقع نتائج لعبة وعاء‎ :٤-١ حالة عملية‎ 


^ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


۷-۲ إعداد تقارير الأعمال 





حالة عملية ؟-0: انتهاء فيضان الورق في 780/4 .... 


۸-۲ تصوير البيانات 





حالة عملية 1-7: ماكفارلان سميث يحسن رؤية الأداء التشغيلي باستخدام ناهء191" 


... Online 





1-1 الأنواع المختلفة للمخططات والرسوم البيانية 





٠١-7‏ نشأة التحليلات المرئية 
۱۱-۲ لوحات المعلومات 


حالة عملية :/-١‏ فريق دالاس كاوبويز يحقق نتائج كبيرة مع تابلوه (نهعاطة1) 
وتكنيون m (Teknion)‏ 


حالة عملية ؟-: تساعد التحليلات المرئية مورد الطاقة في عمل روابط أفضل سس 











الفصل الثالث: التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات .... 
V-Y‏ مقال افتتاحي: استهداف الاحتيال الضر يبي مع ذكاء الأعمال ومستودعات البيانات.. 


٠-۳‏ ذكاء الأعمال ومستودعات البيانات 





حالة عملية :١-*‏ خطة بيانات أفضل: تستفيد شركات الاتصالات الجيدة التأسيس 
من مستودعات البيانات والتحليلات؛ للبقاء على القمة في صناعة تنافسية ...... 








١-۳‏ عملية مستودعات البيانات 


٤-۳‏ بنيات مستودعات البيانات 





0-8 تكامل البيانات وعمليات الاستخراج والتحويل والتنزيل (ETL)‏ 


...... 816$ بريتش بتروليوم 878 لواد التشحيم تحقق نجاح‎ Y-Y dalae dll 








ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





MY 


16 


۹۱ 





1-۳ تطوير مستودع البيانات 


حالة عملية "-:استخدام تحليلات تيراداتالحلول 545 تُسرٌ ع عملية تسليم البيانات الكبيرة  YOV‏ 





























۷-۴ قضايا تنفيذ عملية مستودعات البيانات ... VY‏ 
حالة عملية :6-٠‏ 1810117 يساعد على ربط وكالات الدولة في ولاية ميشغان ...... ۲۷١‏ 
A-Y‏ إدارة مستودع البيانات» والمشكلات الأمنية» والاتجاهات اممستقبلية ... yya‏ 
-Y‏ إدارة أداء الأعمال Ys.‏ 
حالة عملية 0-۳: ۸4۴۴ تقوم بتحويل بنية ذكاء الأعمال التحتية وتحقق عائد 

استثمار بنسبة >٤١‏ في ثلاث سنوات ۹٤‏ 
٠١-۳‏ مقياس الاداء .. YA‏ 
٠١-۳‏ بطاقات الأداء المتوازنة . Yey‏ 
11-7 ستة سيجما كنظام لقياس الأداء v.o m‏ 
حالة عملية :1-١‏ بطاقة درجة رضا العملاء الخاصة ب Expedia-com‏ ... ۳۹ 


الفصل الرابع: التحليلات التنبؤية :)١(‏ عمليةء وطرق» وخوارزميات التنقیب ف‌البيانات.. هلال 


١-٤‏ مقال افتتاحي: قسم شرطة ميامي ديد يستخدم التحليلات التنبؤية للتنبق 








ro lesi 
"m مفاهيم وتطبيقات التنقيب ف البيانات‎ ۲-٤ 

حالة عملية :١-6‏ 77158 هي تعزيز لتجربة العملاء مع الحد من الاحتيال بالتنقيب 
في البيانات والتحليلات التنبؤية ... yr‏ 





حالة عملية 6-!: احتفاظ شركة 611 بذكاء وفعالية تحليلاتهاف القرن الحادي والعشرين.. غ6١‏ 


... تطبيقات التنقيبففي البيانات‎ t-e 





ye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الموضوع 
حالة عملية ع-: التحليل التنبؤي والتنقيب في البيانات يساعد في وقف تمويل الإرهاب an‏ 





........ عملية التنقيب في البيانات‎ ٤-٤ 


حالة عملية ع-4: يساعد التنقيب في البيانات في أبحاث السرطان me‏ 








غ-0 طرق التنقيب في البيانات ...... 
Health à 5,5 eas 23 :0-€ 4 Alae à JU‏ م1106 التحليلات التنبؤية المتقدمة 
للتركيز على العوامل التي تؤثر بالفعل على قرارات الرعاية الصحية للأشخاص سس 
1-٤‏ أدوات برمجيات التنقيب في البيانات 





حالة عملية 1-6: التنقيب في البيانات ينتقل إلى هوليوود: توقع النجاح المالي للأفلام e‏ 
V-E‏ مشكلات خصوصية التنقيب في البيانات» والخرافات؛ والأخطاء الفادحة سس 


حالة عملية 6-/: توقع أنماط شراء العملاء - Target à‏ 





الفصل الخامس: التحليلات التنبؤية (۲): تحليلات النص والويب ووسائل 
التواصل الاجتماعي ........ 
١-5‏ مقال افتتاحي: الآلة مقابل الإنسان على 120854: قصة واتسون .... 
٠-0‏ نظرة عامّة على تحليلات النص والتنقيب في النص .... 
حالة عملية0-١:‏ مجموعة التأمين تعمل على تقوية إدارة المخاطر مع حل التنقيب في النص س. 
٠-٥‏ معالجة اللغات الطبيعية (NLP)‏ 














حالة عملية 0-!: استخدام AMC OKL‏ التحليلات لجذب مشاهدين جدد 
وتقييم التوقعات وإضافة القيمة للمعلنين في عام متعدد القنوات ... 
٠-٥‏ تطبيقات التنقيب في النص ... 








حالة عملية 0-: التنقيب للكشف عن الأكاذيب ... 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


£14 


۹ 


e 


EA 


E. 


rE 


era 


££ 












































الموضوع الصفحة 

حالة عملية 6-0: إدراج العميل ضمن معادلة الجودة: Lenovo ggu) paii‏ 
التحليلات من أجل إعادة التفكير في إعادة تصميمها EV‏ 
0-0 عملية التنقيب في النص to.‏ 
حالة عملية ه-0: مسح بحوث الأدبيات بالتنقيب في النص .... EON‏ 
1-0 تحليل المشاعر . E‏ 
حالة عملية 1-0: إنشاء تجربة رقمية فريدة لرصد اللحظات المهمة في ويمبلدون ...... EIT‏ 
5-/ نظرة عامّة على التنقيب في الويب EA‏ 
6-0 محركات البحث ..... £A‏ 
حالة عملية 0-/: فهم لماذا يؤدي التنازل عن عربات التسوق إلى زيادة مبيعات 
بمقدار ٠١‏ مليون دولار 1 
4-0 التنقيب في استخدام الويب (تحليلات الويب) ... £M‏ 
٠٠-٥‏ التحليلات الاجتماعية ...... oV‏ 
حالة عملية 6-0: فودكا تيتو تؤسس الولاء للعلامة التجارية بإستراتيجية اجتماعية 

0۹ 
الفصل السادس: التحليلات التوجيهية: التحسين وال محاكاة ..... oy,‏ 
١-1‏ مقال افتتاحي: منطقة فيلاديلفيا التعليمية تستخدم التحليلات التوجيهية 
لإيجاد حل أمثل لإبرام عقود خطوط سير الحافلات ovv‏ 
٠٠‏ اتخاذ القرار بناءً على النموذج ort‏ 
حالة عملية :١-5‏ النقل الأمثل للبيانات من الخادم 10017516212 لشركة إكسون 
موبیل ۸011 E××٥‏ من خلال نظام دعم القرار 0858 .- oro‏ 
حالة عملية 1-!: استخدام تطبيقات ذكاء الأعمال من قبل شركة إنجرام مايكرو 
Ingram Micro‏ من أجل اتخاذ قرارات التسعير. ovra‏ 





w‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الموضوع 
Sa Y-1‏ النماذج الرياضية لدعم القرار 
1- التأكدء وعدم التأكدء والخطر ...... 








ilo‏ عملية 5-: استخدام الخطوط الجوية الأمريكية نمذجة التكلفة اللازمة 
لتقييم عدم التأكد من عطاءات طرق الشحن 


0-1 نمذجة القرار باستخدام جداول البيانات ... 








حالة عملية 6-1: استخدام بنسيلفينيا أدو Pennsylvania Adoption) go lius] zo‏ 
286 لنموذج جدول البيانات من أجل تحسين تطابق الأطفال مع الأسر. 
ilo‏ عملية :04-١‏ استخدام مؤسسة مترو ميلز أون وييلز تريجر J‏ 
s Excel gly (Metro Meals on Wheels Treasure Valley)‏ أجل البحث 
عن خطوط السير المُتَلى للتسليم....... 
A‏ تحسين البرمجة الرياضية ..... 
حالة عملية :1-١‏ مساعدة نموذج البرمجة العددية المختلطة مركز جامعة تينيسي 
6556 الطبي في وضع جدول مواعيد الأطباء 
1 الأهداف المتعددة. وتحليل الحساسية. وتحليل «ماذا - لو» والبحث عن 
الهدف .. 
A‏ تحليل القرار باستخدام جداول القرار وأشجار القرار ... 
9-1 مقدمة في المحاكاة ... 


























حالة عملية 1-/: محاكاة آثار تدخلات الالتهاب الكبدي 8 
حالة عملية :A-‏ استخدام شركة كوزان 00535 المحاكاة من أجل تحسين سلسلة التوريد 
للطاقة ... 





... المحاكاة التفاعلية ال مرئية‎ ٠١-1 





حالة عملية 1-1: تحسين قرارات جدولة محل العمل من خلال الترددات اللاسلكية 
21 التقييم القائم على المحاكاة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





oor 


oot 


00^ 


60^ 


oV! 
ow 
O۸! 


OAY 


o4. 


o4۲ 


oge 























الموضوع الصفحة 

الفصل السابع: مفاهيم وأدوات البيانات الضخمة vv‏ 
۱-۷ مقال افتتاحي: تحليل حركة العملاء في شركة اتصالات باستخدام طرق البيانات 

الضخمة . IA‏ 
۲-۷ تعريف البيانات الضخمة ..... TE‏ 
حالة عملية :١-۷‏ بيانات بديلة لتحليلات أو توقعات السوق ..... 31۸ 
۳-۷ أساسيات تحليلات البيانات الضخمة .... wY‏ 
حالة عملية ۲-۷: بنك توب فایف انفستمنت äv Top Five Investment‏ 

التوصل إلى مصدر واحد للحقيقة wI‏ 
٤-۷‏ تقنيات البيانات الضخمة ..... Ys‏ 
حالة عملية ۳-۷: حل البيانات الضخمة الخاص ب 884¥ ....... wa‏ 





حالة عملية :٤-۷‏ فهم جودة ودقة معلومات دعم الرعاية الصحية على تويتر ...2 741 





160 .... البيانات الضخمة ومستودعات البيانات‎ ٥-۷ 
3oY .. موردو ومنصات البيانات الضخمة‎ 1-۷ 





حالة عملية :0-١/‏ استخدام وسائل التواصل الاجتماعي للتنبؤ الفوري بنشاط الانفلونزا... 507 
حالة عملية 1-7: تحليل أنماط المرض من مستودع بيانات السجلات الطبية 
الإلكترونية ... Spec as‏ 








/أدلا البيانات الضحمة وتخليلات العيار :.. ww‏ 
۸۷ تطبیقات تحلیلات التيار. wi‏ 





حالة عملية /ا-/ا: استخدام 5316510566 لتيار البيانات لتحسين قيمة العميل ..... ١۷١‏ 
الفصل الثامن: الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات....  MW‏ 
١-6‏ مقال افتتاحى: تحليل بيانات الاستشعار يساعد سيمنس (51672625) على 


تجنب أعطال القطارات ... e‏ 





M‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





۸ إنترنت الأشياء 
حالة عملية :١-8‏ شركة زوارق 511765110016 تستخدم تحليل البيانات الفوري 
لإخطار المتسابقين وا مشجعين e‏ 
حالة عملية 8-!: شركة 101ا Aut 0n‏ 12015011 تراقب أصول استكشاف النفط 
والغاز غالية الثمن 








Jliz ومنصة‎ Pitney Bowes حالة عملية 8-!: التعاون المشترك بين بيتي باوز‎ 
~~ ZOYI gad General Electric IoT h z9) 





7-8 الحوسبة السحابية وتحليلات الأعمال 





....... التحليلات القائمة على الموقع بالنسبة للمنظمات‎ ٠-۸ 








التحليلات الجغرافية المكانية ... 
Great Clips :£-A àlase il>‏ تستخدم التحليلات المكانية لتوفير الوقت في قرارات 
ا موقع .. 
حالة عملية 0-۸: ستاربكس تستغل نظم الممعلومات الجغرافية (615) وتحليلاتها 
لتنمو في كل أنحاء العام ... 
حالة عملية 1-4: مطعم 01112005 يستهدف عملاء للسندويشات التي يقدمها — 








0-8 القضايا القانونية. والخصوصية, والأخلاقية .. - 








1-8 آثار التحليلات في المنظمات: نظرة عامة ..... 


وحدات تنظيمية جديدة .... 





إعادة تصميم الُنظمة من خلال استخدام التحليلات 
أثر التحليلات على أنشطة المديرين» وأدائهم» ورضاهم الوظيفي ..... 
8-/ عاط البيانات كمهنة .... 











ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


AV 


AA 


VY 


VY 


VV 


Ve. 
Ve! 
Ver 


Ver 


M 


موجز تمهيدي: 

لقد أصبح تحليل البيانات هو المنهج الرائد في تقنية العقد الحالي. وتقوم شركات مثل 
أي بي (IBM) el‏ وإس إيه بي (SAP)‏ وإس إيه إس (545). وتيراداتا (Teradata)‏ وأوراكل 
»)0ac1e(‏ ومایکروسوفت (Dell) Lag (Microsoft)‏ وغيرها من الشركات بإنشاء وحدات 
تنظيمية جديدة تركّز على التحليلات التي تساعد الشركات على أن تصبح أكثر le‏ وكفاءةً في 
عملياتها. ويستخدم صانعو القرار مزيدًا من الأدوات المحوسبة لدعم أعمالهم؛ بل إِنَّ المستهلكين 
يستخدمون أدوات تحليليةء بشكلٍ مباشر أو غير مباشر؛ من أجل اتخاذ قرارات بشأن الأنشطة 
المعتادة كالتسوق والصحة/ الرعاية الصحية والسفر والترفيه. وقد تطوّر مجالا ذكاء الأعمال 
81 وتحليلات الأعمال 84 بسرعة هائلة ليصبحا أكثر تركيرًا على التطبيقات المبتكرة لاستخلاص 
المعلومات من تيارات البيانات التي لم يكن من الممكن الحصولٌ عليها فى وقت ما في الماضي أو كان 
تحليلها على نحو أقل بكثير حتى باستخدام أيِّ وسيلة متطوّرة في هذا الوقت. وتظهر التطبيقات 
الجديدة يوميًا في مجال الرعاية الصحية» والرياضة» والسفرء والترفيه» وإدارة سلاسل التوريد 
والمرافق» وكل صناعة تقريبًا قد تتخيلها. ومن ثم أصبح مصطلح التحليلات سائدًا وتطوّر بالفعل 
إلى مصطلحات أخرى مثل علم البيانات وهو أحدث تجسيدٍ للتعلّم العميق وإنترنت الأشياء. 

وتُقدَّم هذه الطبعة منظورًا إدارياً لتحليل الأعمال؛ بدءًا من التحليلات الوصفية (مثل: 
طبيعة البيانات» والنمذجة الإحصائيةء وتصوير البيانات» وذكاء الأعمال) لينتقل إلى التحليلات 
التنبؤية (مثل: التنقيب ف البيانات» والتنقيب ف النص/ الويب» والتنقيب في وسائل التواصل 
الاجتماعي)» ومن ES‏ إلى التحليلات التوجيهية (مثل: التحسين وا محاكاة) وانتهاءً بالبيانات 
aial‏ والاتجاهات Alii ubl‏ والخصوصيةء والاعتبارات الإدارية. ويدعم الكتابُ موقع 
ويب .(pearsonhighered.com/sharda)‏ وكذلك الموقع .dssbibook. com Jäir—ubl‏ كما 
سنوفر روابط إلى برامج تعليمية من خلال قسم خاص لواقع الويب. 

إن الغرض من هذا الكتاب؛ هو تزويد القارئ بهذه التقنيات التي تُسمّى gas‏ تحليلات 
الأعمال أو علم البيانات؛ ولكنها كانت معروفةً من قبل بأسماء أخرى. ويعرض هذا الكتاب 
أساسيات الأساليب والطريقة التي يتم من خلالها إنشاء هذه الأنظمة واستخدامها. ونتبع في 
ذلك نهج 81:8 لتقديم هذه المواضيع: 150051056 523JI) Experiences (o5, sl)‏ 3 
3 ا(الاستكشاف). ويوفر الكتابُ في المقام الأول التعرّض لمختلف أساليب التحليلات 
وتطبيقاتها. والفكرة هي أن الطالب سوف يكون مصدر إلهام لتعلّم كيفية استخدام المنظمات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ww‏ 


موجز تمهيدي 


الأخرى للتحليلات؛ من أجل اتخاذ القرارات أو للحصول على ميزة تنافسية. ونعتقد أن مثل 
هذا التعرض با يحدث باستخدام التحليلات وكيفية تحقيقه هو المكون الرئيس للتعلم بشأن 
التحليلات. وفي وَصْف الأساليبء نعرض كذلك أدوات البرمجيات المحدّدة التي يمكن استخدامها 
لتطوير مثل هذه التطبيقات. ولا يقتصر الكتاب على أداة برمجية واحدة. حتى يستطيع الطالب 
تجريب هذه الأساليب باستخدام أيّ عددٍ من أدوات البرمجيات المتاحة. كما نقدّم اقتراحات 
مُحدَّدة في كلّ فصل حتى يتسنى للطالب والأستاذ استخدامٌ هذا الكتاب الذي يحتوي على 
العديد من أدوات البرمجيات المختلفة. وسيتضمّن موقع الويب المصاحب لكتابنا أدلة لبرمجيات 
محددة: ولكن يمكن للطلاب اكتسابٌ الخبرة في هذه الأساليب بطرق عديدة ومختلفة. Mysig‏ 
JS oc ol dab‏ من التعرض والتجريبه وَيحفرا القراء على استكماف إمكانات هذه الأساليب 
كل في مجاله. ولتسهيل مثل هذا الاستكشاف؟ نقوم بتضمين التجارب التي توجههم إلى شبكة 
جامعة تيراداتا 1٠۲4441‏ وغيرها من ال مواقع» والتي تشمل تدريبات قانئمة على عمل الفريق 
إذا لزم الأمر. وستُسلْط الضوء أيضاً على التطبيقات الجديدة والمبتكرة التي نتعلمها على موقع 
الكتاب على شبكة الإنترنت. 

وتركز معظم التحسينات المحدّدة التي أدخلّت في هذه الطبعة الرابعة على أربعة مجالات 
هي: إعادة التنظيم» والفصول الجديدةء وتحديث المحتوىء وتركيز أكثر وضوحاً. وعلى الرغم من 
التغييرات العديدة؛ فقد حافظنا على الشمولية وسهولة الاستخدام التي جعلت الكتاب من الكتب 
الرائدة في السوق. وأخيرًّ؛ نقدم موادًا دقيقةً ومحدثةً غير متوفرة في أيّ نص آخر. 


ما الجديدٌ في الطبعة الرابعة؟ 


ولأننا نهدف إلى تحسين النص؛ قمنا في هذه الطبعة بإعادة تنظيم جوهرية للنص نركّز 
من خلالها على تحليلات الأعمال. وقد تمَّ تنظيمُ هذه الطبعة لتتضمن ثلاثة أنواع رئيسة من 
تحليلات الأعمال (وهي: الوصفية» والتنبؤية» والتوجيهية). وتحتوي الطبعة الجديدة على العديد 
من الإضافات التي تتناسب مع التطورات الحديثة» وقد تمّ حذف المحتويات التي أصبحت لا 
تتلاءم مع هذه التطؤرات. وقد أجريّت التغبيراث الرئيسية التالية: 
- التنظيم الجديد: يقر هذا الكتابٌ بثلاثة أنواع من التحليلات: الوصفية» والتنبؤية» والتوجيهية؛ 
وهو التصنيف الذي يروج له معهدٌُ بحوث العمليات وإدارة (INFORMS) jasså] pola]!‏ 
يقدّم الفصل الأول ذكاء الأعمال والتحليل مع التركيز على تطبيقاتهما في العديد من الصناعات. 
كما يتضمّن هذا الفصلٌ s dole fat UIS‏ النظام البيئي للتحليل لمساعدة المستخدم على 
۸ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


موجز تمهيدي 


استكشاف جميع الطرق المختلفة التي يمكن المشاركة فيها وتنميتها في بيئة التحليلات. ويلي 

ذلك نظرةٌ عامة على الإحصاءات وأهمية البيانات والتحليلات الوصفية/ التصوير في الفصل 

الثاني. ويتناول الفصل الثالث مستودع البيانات وأّسّس البيانات بما في ذلك المحتوى المُحدَّتْ؛ 

وخصوصًا بحيرات البيانات. ويغطي الفصل الرابع التحليلات التنبؤية. أمّا الفصل الخامس 

فيوسّع من نطاق تطبيق التحليلات إلى النص وا مواقع الإلكترونية ووسائل التواصل الاجتماعي. 

ويتناول الفصل السادس التحليلات التوجيهية؛ وخاصةً البرمجة الخطية والمحاكاة. وهو محتوى 

جديد تمامًا بهذا الكتاب. ويقدّم الفصل السابع أدوات ومنمَّات البيانات الضخمة. ويُختتم 

الكتابٌُ بالفصل الثامن والاتجاهات وام مواضيع الحديثة الظهور في تحليلات الأعمال بما في ذلك 

تحليلات الموقع» وإنترنت الأشياء والاعتبارات الخصوصية/ الأخلاقية في التحليلات. وتعترف 

مناقشة النظام البيئي التحليلي بالتحليلات التوجيهية كذلك. 

- الفصول الجديدة: تت إضافة الفصول التالية: 

- الفصل الثاني: التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية. وتصوير 
البيانات ويهدف هذا الفصلٌ إلى وضع حجر الأساس للدراسة التحليلية عن طريق فهم 
شامل لطبيعة البيانات» وهو العنصرٌ الرئيس لأيٍّ دراسة تحليلية. ويلي ذلك» عرض 
النمذجة الإحصائية كجزء من التحليلات الوصفية. ولقد أصبح تصويرٌ البيانات جزءًا 
شائعًا من أيّ تقريرٍ عن الأعمال و / أو أيّ مشروع تحليلي وصفي؛ وبالتاليه نقوم بشرح 
ذلك بالتفصيل في هذا الفصل. ونعرَّز الفصل بالعديد من الحالات والأمثلة في عام 
ZVO) all‏ من المواد الجديدة). 

- الفصل السادس: التحليلات التوجيهية: التحسين والمحاكاة» ويقدّم هذا الفصل مادةً 
iios d los‏ لهذا الكتاب. ويرگز الفصل على نمذجة التحسين في إكسيل باستخدام 
تقنيات البرمجة الخطية. كما يقدّم مفهوم ا محاكاة. والفصل هو نسخة محدثة مواد 
فصلين في كتابنا 058 الطبعة العاشرة. وهو بالنسبة لهذا الكتاب فصلٌ LE oae‏ 
)433 مواد جديدة). 

- الفصل الثامن: الاتجاهات المستقبلية. والخصوصية: والاعتبارات الإدارية في التحليلات 
ويتناول هذا الفصلٌ العديد من الظواهر الجديدة التي تغيّر أو من المحتمل أن تغير 
التحليلات. حيث يتناول تحليلات الجغرافيا المكانية» وإنترنت الأشياء. وتحدينًا كبيرآ 
للمواد المتعلقة بالتحليلات المستندة إلى الحوسبة السحابية. كما يقوم بتحديث 
ما تناولته الطبعة الأخيرة بشأن الاعتبارات الأخلاقية والعملية ZV-)‏ مواد جديدة). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1۹ 


موجز تمهيدي 


- الفصول المنقحة: وقد تمّ تنقيحٌ جميع الفصول الأخرى وتحديثها كذلك. وفيما يلي ملخصٌ 

للتغيرات في هذه الفصول الأخرى: 

- الفصل الأول: نظرة عامة على ذكاء الأعمال والتحليلات» وعلم البيانات: تمت إعادة كتابة 
هذا الفصل وتوسعته بشكل كبير؛ بحيث يُفتتح بمقالة قصيرة جديدة تغطي تطبيقات 
متعددة من التحليلات في مجال الرياضة. وهو يقدّم الأنواع الثلاثة من التحليلات على 
النحو الذي اقترحته مؤسسة إنفورمز (12780183/15): التحليلات الوصفية» التنبؤية, 
والتوجيهية. وكما أشرنا سابقاً؛ فإن هذا التصنيف يُستخدّم في التوجيه لإعادة تنظيم 
كاملة للكتاب نفسه (المحتوى السابق؛ ولكن بشكل جديد). ثم يتضمن عدة أمثلة 
جديدة من التحليلات في مجال الرعاية الصحية وفي قطاع تجارة التجزئة. وأخيرًا؛ فإنه 
يُختتم بتغطية مُوسّعة scia Blois‏ كبير للنظام البيئي للتحليلات بلنح الطلاب شعورًا 
باتساع نطاق صناعة التحليلات وعلم البيانات (حوالي ٠١‏ مواد جديدة). 

- الفصل الثالث: التحليلات الوصفية (۲): ذكاء الأعمال ومستودع البيانات: وَيُعَدُ هذا 
الفصل فصلا قديًا أضيف إليه بعص الأقسام الفرعية الجديدة (مثل: بحيرات البيانات) 
وحالات جديدة (حوالي ۳۰ مواد جديدة). 

- الفصل الرابع: التحليلات التنبؤية :)١(‏ عمليةء وطرقء وخوارزميات التنقيب في 
البيانات» وهذا أيضاً فصل قديمٌ مع تنظيم/ تدفق جديد للمحتوى وبعض الحالات 
الجديدة (حوالي <٠١‏ مواد جديدة). 

- الفصل الخامس: التحليلات التنبؤية (؟): تحليلات النصء والويب» ووسائل التواصل 
الاجتماعي وهو فصل قديم مع تنظيم/ تدفق جديد للمحتوى وبعض الحالات الجديدة 
(حوالي 0 مواد جديدة). 

- الفصل السابع: مفاهيم وأدوات البيانات الضخمة: كان هذا الفصل هو الفصل 
السادس في الطبعة السابقة. وقد تمَّ تحديثه بمقدمة افتتاحية مختصرة وحالات 
جديدة: وتغطية لتيراداتا أستر (Teradata Aster)‏ ومواد جديدة تتعلق بالبيانات 
البديلة (حوالي ٠١‏ مادة جديدة). 

- فريق تأليف مجدد: استنادًا إلى المحتوى المتميز الذي قام بإعداده مؤلفو الطبعات السابقة 
Deleng Shardag Turban)‏ وعKin)‏ قام بتنقيح هذه الطبعة کل Ramesh Sharda ja‏ 


2 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


موجز تمهيدي 


.Dursun Deleng‏ 4.35 عمل الأخيران على نطاق واسع في التحليلات بما لهما من كفاءة 
في المجال الصناعي فضلاً عن الخبرة البحثية. 
- طباعة ملونة: إننا سعداء حقاً أن يظهر هذا الكتاب بالألوان. وحتى الأشكال التي وردت في 
laa) duel doa Gea‏ حتى مقع جنيزة الألوآن. :إن السفخداة:اللون حزن العذية من 
الأمثلة التصويرية والمواد الأخرى كذلك. 
- موقع ويب مُحدّث ونشط: يكن لقراء هذا الكتاب الآن الوصول إلى موقع على شبكة الإنترنت 
يشتمل على روابط خاصة بالأخبارء والبرمجيات» والبرامج التعليمية وحتى مقاطع فيديو يوتيوب 
ذات الصلة بالمواضيع التي يغطيها الكتاب. وهذا الموقع سوف .5$ -dssbibook.com (3 les‏ 
- محتوى مُنقّح ومُحدَّتْ: لقد استهللنا جميع الفصول تقريبًا مقدمات تستند على القصص والأحداث 
الجارية. وبالإضافة إلى ذلك؛ تمّ تحديث الحالات العملية في جميع فصول الكتاب لتشمل الأمثلة 
الحديثة لتطبيقات أساليب/ نماذج معينة. وقد منت إضافة روابط موقع ويب جديدة في جميع 
فصول الكتاب. كما حذفنا العديد من الروابط والمراجع القديمة. وأخيراً؛ فقد أوردنا في معظم 
الفصول تدريبات ومهام جديدة على الإنترنت» وأسئلة مناقشة في جميع فصول الكتاب. 
- روابط إلى شبكة جامعة تيراداتا (۳0۸): وتتضمن معظم الفصول روابط جديدة إلى شبكة 
(teradatauniversitynetwork.com) blsl;3 ázalz-‏ 
- عنوان الكتاب: وكما هو ls‏ بالفعل؛ فقد تغير عنوان الكتاب وتركيزه بشكلٍ كبير. 
- دعم البرمجيات: يوفر موقع 11721 على شبكة الإنترنت دعم البرمجيات دون أيّ رسوم. كما 
يوفر روابط إلى التنقيب في البيانات مجانًا وغيرها من البرامج. وبالإضافة إلى ذلك؟ يوفر الموقع 
تدريبات على استخدام مثل هذه البرامج. 
- الباقة الإضافية QA dias all à ác saa (5 :www.pearsonhighered.com/sharda‏ 
الدعم التقني لتعزيز تجربة التعليم والتعلم. كما تتوفّر المواد الإضافية لكل من الطالب 
والمدرب على موقع الكتاب الإلکتروj« :pearsonhighered.co/sharda‏ 
-١‏ دليل المدرب: يتضمّن دلِيلٌ المدرب أهداف Lað JS piel‏ واقتراحات التدريس 
à Le)‏ ذلك تعليمات للمشاريع). ويتوفر ذليلٌ المدرب في قسم هيئة التدريس في 
.pearsonhighered.com/sharda‏ 
۲- ملف بند الاختبار وبرنامج 61ع18560: إن ملف بند الاختبار عبارة عن مجموعة 
شاملة من أسئلة (صح / خطأ). وأسئلة الاختيار المتعدد, واملاً الفراغء وأسئلة مقالية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Y‏ 


موجز تمهيدي 


ويتم تصنيف الأسئلة حسب مستوى الصعوبة: ويُشار إلى الإجابات برقم صفحة الكتاب 

التى توجد بها. ويتوفّر ملف بند الاختبار في .TestGens Microsoft Word‏ ويتوفر 

برذ ا توليد اختبار 8010162608 www.pearsonhighered.com/ j Pearson‏ 

irc‏ ويتوافق البرنامج مع كل من الحاسب الشخصي وأجهزة 14€ ويتم تنزيله مع 

جميع أسئلة ملف بند الاختبار. ويمكنك أن تقوم يدوياً أو عشوائياً بعرض أسئلة الاختبار 
والسحب والإسقاط لإنشاء اختبار. ويمكنك إضافة أو تعديل أسئلة بنك الاختبار حسب 

الحاجة. ويتم تحويل برمجية 1۴516158 حتى هكن استخدامها في BlackBoard ùjم Js‏ 

و js sl 5-55 .Angels D2Ls Moodles WebCT‏ عاى هذه النسخ على موقع 

05-5 Respond us à TestGen eb كما يتوفر‎ .pمearsonhighered.com/sharda‎ 

الاطلاع على -www.respondus.com‏ 

- شرائح باوربوينت: تتوفر شرائح باوربوينت التي تتميز بخاصية الإضاءة؛ بناءً على 

المفاهيم الأساسية في النص. ويمكن لأعضاء هيئة التدريس تنزيل شرائح باوربوينت من 

.pearsonhighered.com/sharda 
شكر وتقدير:‎ 

Lal p s‏ من الأفراد اقتراحات وانتقادات منذ نشر الطبعة الأولى من هذا الكتاب. وقد 
شارك العشراثٌ من الطلاب في الاختبارات الصفية لمختلف الفصول والبرامج والمشكلات وساعدوا 
في جمع المواد. ولا يمكن ذكر اسم كلّ من شارك في هذا المشروع؛ ولكننا نوجّه الشكر لهم جميعاً. 
كما قدَّم البعض مساهمات كبيرة» هؤلاء يستحقون تقديراً خاضًاء 

gl‏ نقدَّر جهود الأفراد الذين قاموا بمراجعات رسمية للطبعات من الأولى حتى الثالثة 
(الانتماءات المدرسية اعتباراً من تاريخ المراجعة): 
- آن أكسوت» كلية مجتمع بيدمونت ال مركزية. 
- باي أرينزء جامعة دريكسل. 
- أندي بورشرزء جامعة ليبسكومب. 
- رانجيت بوسء جامعة نيو مكسيكو. 
- مارق كروسلاند. جامعة أمريكا الوسطى الناصرية. 
- كورت إنجمانء كلية أيونا. 


Yy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


موجز تمهيدي 


- بديع فرح» جامعة ميشيغان الشرقية. 
- غاري فارارء كلية كولومبيا. 
- جيري فيرميستاد. معهد نيو جيرسي للتكنولوجيا. 
- كريستي م. فولرء جامعة لويزيانا التقنية. 
- مارتن غروسمان» كلية بريدج ووتر الحكومية. 
- جهانکیر کرهي» جامعة کولورادوء دنفر. 
- هوي لي» جامعة ميشيغان الشرقية. 
- ناتالي نازارينكوء جامعة نيويورك فريدونيا الحكومية. 
- جو إنج لي بارتريدج» جامعة كونيتيكت الحكومية المركزية. 
- غريغوري روزء جامعة واشنطن الحكومية» فانكوفر. 
- خواجة سعيد» جامعة ويتشيتا الحكومية. 
- كالا تشاند سيلء جامعة لويولا ماريماونت. 
- جوشوا س. وايت» دكتوراه» جامعة نيويورك الحكومية معهد الفنون التطبيقية. 
- روجر ويلسون» جامعة فيرمونت الحكومية. 
- فنسنت يو جامعة ميسوري للعلوم والتكنولوجيا. 
glis Hb -‏ جامعة ساحل خليج فلوريدا. 

ونقدّر أيضاً جهود الأفراد الذين قاموا بمراجعات رسمية لهذا النص وكتابنا الآخر 255 - ذكاء 
الأعمال والتحليلات: نظم دعم اتخاذ القرارء الطبعة العاشرة. بيرسون للتعليم: Y:‏ 

ثانياً أسهم العديدٌ من الأفراد مواد في النص أو المواد الداعمة. وقد قدّمت سوزان باسكن 
من تيراداتا والدكتور ديفيد شريدر مساعدةً خاصة في تحديد المحتوى الجديد لكل من ×10 
وتيراداتا للكتاب وترتيب الأذونات لنفس الغرض. كما أسهم الدكتور ديف شريدر في افتتاح 
المقالة القصيرة للكتاب. تضمَّنت هذه المقالة القصيرة أيضاً مواد طوّرها الدكتور أشيش جوبتا 
من جامعة أوبورن وجاري ويلكيرسون من جامعة تينيسي تشاتانوجا. وسوف توفر مقدمة 
رائعة للتحليلات. نشكر أيضاً 121801315 على إذنهم بتسليط الضوء على المحتوى من 
الواجهات. كما نعترف بدور الأفراد التالية أسماؤهم في المساعدة في تطوير هذا الإصدار من 
الكتاب؛ وهم: بانكوش كالجوتراء وبراسون ماٹور» وروبیش آجاروال» وشوبهام سينغ: ونان ليانغ» 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yr‏ 


موجز تمهيدي 


وجاكوب بيرسونء وكينزي كليميرء وإيفان مورليت (وجميعهم من جامعة أوكلاهوما الحكومية). 
Teradata Aster (35, el 4 35‏ وخاصةً مارك أووت بتوفير المواد اللازمة للمقالة الافتتاحية 
للفصل السابع. إذ يتم ÁS‏ مواد å Aster‏ الفصل ۷ من أدلة التدريب الأخرى التي طوّرها 
جون ثوما وجريج بيثاردي. كما قاد الدكتور برايان ليكلايرء مدير قسم المعلومات في شركة 
28 مساهمات من العديد من دراسات الحالة الصحية الواقعية التي طوّرها فريقه في 
.Humana‏ وأسهم ابهيشيك راني من 701621 برؤيته للتحليلات في صناعة بيع التجزئة. 
كما نتوجه بالشكر والتقدير للدكتور ريك ويلسون على التدريبات ال ممتازة لتدريس وممارسة 
مهارات البرمجة الخطية في 1ع8:0. كما سمح لنا مات تارك بتكييف مواد النظام البيئي لإنترنت 
الأشياء الخاصة به. ويقرٌ راميش بالمساعدة التي قدَّمتها ابنته» رشي شاردا سن في تحرير النسخ. 
بالإضافة إلى ذلك؛ قَّمِ طلابٌ الدكتوراه وزملاؤنا من الباحثين التالي أسماؤهم محتوّى أو نصيحةً 
ودعمًا للكتاب بعدة طرق مباشرة وغير مباشرة: 

- أسيل أوزتيكين» جامعة ماساتشوستس - لويل. 

- إينيس إريارسويء جامعة سيهير. 

- حامد مجيدي زولبانين» جامعة بول الحكومية. 

- أمير حسن زاده. جامعة رايت الحكومية. 

- سوبافيتش (فون) بنجنات» جامعة داكوتا الشمالية الحكومية. 

- كريستي فولرء جامعة بويز الحكومية. 

- دانييل أسامواه. جامعة رايت الحكومية. 

- سليم زايم» جامعة إسطنبول الفنية. 

- نيهات كاساب» جامعة سابانسي. 

6 بالنسبة للنسخة السابقة» نقر بمساهمات ديفيد iıج .(JDA Software Group, 11c.)‏ 
ومن بين المساهمين الأساسيين الآخرين في الإصدار السابق جي أرونسون (جامعة جورجيا)» والذي 
كان مؤلقًا مشارگاء والمساهم في فصل مستودعات البيانات؟ ومايك جول (جامعة أريزونا الحكومية)» 
والتي تم إدراج إسهاماتها في الفصل ١؛‏ وكذلك تي بي ليانج (جامعة صن - يت سنء تايوان)» والذي 
أسهم بمواد حول الشبكات العصبية في الإصدارات السابقة. كما تعاونت جودي لانج معنا جميعًا في 
توفير التحريرء وقادتنا خلال المشروع بأكمله في الإصدار الأول. 


ve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


موجز تمهيدي 


Cul;‏ تعاون العديدٌ من الموردين من خلال توفير دراسات الحالة و / أو برمجيات العرض 
التوضيحي للإصدارات السابقة وهم: أكسيوم (ليتل روكء أركنساس). برمجيات كاليفورنيا العلمية 
(نيفادا سيتيء كاليفورنيا)» كاري هاروين من تطوير كاتاليست (يوكا فالي» كاليفورنيا)» آي بي إم 
(سان كارلوسء كاليفورنيا)» شركة دي إس جروبء (جرينيتشء» كونيكتيكت)» جريجوري بياتيتسكي 
شابيرو من KDnuggets.com‏ جاري لين من dedus) .NeuroDimension Inc‏ فلوريدا)» 
برمجيات باليساد (نيوفيلد. نيويورك)» برومیسد لاند للتقنیات (نیو هافن» کونیکتیکت)» نظم 
سالفورد (لا جولاء كاليفورنيا)» سينس الشبكات (نيويورك» نيويورك)» جاري ماينر من شركة ستات 
سوفت (تولساء أوكلاهوما)» شركة وارد سيستمز جروب» إنك (فريدريك» ميريلاند)» شركة نظم 
آيديا فيشرء (إیرفینج» کالیفورنیا)» ونظم ورد تك (أورینداء كاليفورنيا). 

خاممساً شكدٌ خاص لشبكة جامعة تيراداتا وخاصة سوزان باسكن مديرة البرنامج؛ وهيوج 
واتسون الذي أسّس شبكة جامعة تيراداتاه ومايكل جولء وبارب ويكسوم: وماري جروس على 
تشجيعهم لنا على ربط هذا الكتاب بشبكة جامعة تيراداتا وتوفير مواد مفيدة له. 

أخيراً؛ نثني على فريق بيرسون: سامانتا لويس التي عملت معنا على هذه المراجعة وقامت 
بتنظيم الإخراج الملون للكتاب؛ وفريق الإنتاج» آن بوليدوء وريفاي فيس واناثان والموظفون في 
سينفيوء الذين حوّلوا المخطوطة اليدوية إلى كتاب. 


نود أن نشكر كلّ هؤلاء الأفراد والشركات. فبدون مساعدتهم: لما كان إنشاء هذا الكتاب ممكنًا. 


راميش شاردا 
دورسون ديلن 
إفرايم توربان 


* لاحظ أنَّ روابط موقع الويب ديناميكية؛ فبمجرد مثول هذا الكت اب للطباعةء تم التحقق من أن جميع 
مواقع الويب المذكورة نشطة وصالحة. ولكن في بعض الأحيان تتغير أو تقف مواقع الويب المشار إليها في النص 
بسبب تغيير الشركات لأس مائهاء أو قد يتم شراؤها أو بيعها أو دمجها أو فشلهاء وفي أحيان أخرى تكون مواقع 
الويب معطلةً للصيانة أو الإصلاح أو إعادة التصميم. وفي حين أنَّ معظم المنظمات قد أسقطت البادئة «» 
من مواقعها؛ فإنَّ البعض الآخر لا يزال يستخدمها. إذا واجهت مشكلةٌ في الاتصال بموقع ويب تم الإشارة إليه 
فضلاً تحلى بالصبر وقم ببساطة بتشغيل بحث الويب لمحاولة تحديد الموقع الجديد؛ إذ إنه في معظم الأوقات يمكن 
العثورٌ على الموقع الجديد بسرعة. نعتذر مقدماً عن هذا الإزعاج. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yo‏ 


موجز تمهيدي 


ذكاء الأعمالء والتحليلات» وعلم البيانات - منظور إداري: 


يتناول هذا الكتاب مجموعة من تقنيات الحاسب التي تدعم العمل الإداري؛ وبشكل أساسي 
صنع القرار. وقد كان لهذه التقنيات أثر عميق على إستراتيجية الشركة وأدائها وقدرتها التنافسية. 
وتُسمى هذه التقنيات مجتمعةً ذكاء الأعمال وتحليلات الأعمال وعلم البيانات. وعلى الرغم من 
مناقشة تطور المصطلحات: يتم استخدام هذه الأسماء أيضاً بالتبادل. ويروي هذا الكتاب قصصًا 
عن كيفية توظيف الأفراد الأذكياء لهذه التقنيات لتحسين الأداء والخدمة والعلاقات في الأعمال 
والحكومات والعوامم غير الربحية. 


"n‏ ذكاء الآعمال والتحليلات وعلم البيانات» منظور إداري 


بذة عن المؤلفين: 

- راميش شاردا Ramesh Sharda‏ (حاصل على درجة ماجستير إدارة الأعمال: والدكتوراه. 
من جامعة ويسكونسن - ماديسون)ء وهو نائب العميد لبرامج البحث والخريجينء وعضو في 
واتسون / كونوكوفيليبس» وأستاذ أعضاء مجلس الجامعة للعلوم الإدارية ونظم المعلومات 
في مدرسة سبيرز للأعمال بجامعة أوكلاهوما الحكومية (0517). قام بالتأسيس والإشراف 
على درجة الدكتوراه في إدارة الأعمال في برنامج مديري التنفيذ. وقد تمّ نشرٌ حوالي ٠٠١‏ 
ورقة تصف أبحاثه في كبرى المجلاتء بما في ذلك بحوث العمليات» وعلم الإدارةء وبحوث 
نظم المعلومات: ونظم دعم القرارء ومجلة نظم المعلومات الإدارية. كما قام بتأسيس 415 
© على أنظمة دعم القرار وإدارة المعرفة (516154). يعمل الدكتور شاردا في العديد 
من مجالس التحريرء ا في ذلك مجلة علوم القرارء ونظم دعم القرارء وقاعدة بيانات 
6 . قام بتأليف وتحرير العديد من الكتب النصية والكتب البحثيةء كما يشارك في 
تحرير العديد من كتب سلسلة :1586:م5 (وهي سلسلةٌ متكاملةٌ في نظم المعلومات» 
وواجهات بحوث العمليات/ علوم الحاسب. وسجلات نظم المعلومات). ويشغل حالياً 
منصب المدير التنفيذي لشبكة جامعة تيراداتا. وتتمثل اهتماماته البحثية الحالية في نظم 
دعم القرار وتحليلات الأعمال وتقنيات إدارة الحمل الزائد للمعلومات. 

- دورسون ديلن 26162 18ا1(5: (حاصلٌ على درجة الدكتوراه» من جامعة أوكلاهوما 
الحكومية) وهو عضو سبيرز إندويد في إدارة الأعمالء وعضو في مؤسسة باترسون في 
تحليلات الأعمالء ومدير أبحاث مركز تعاون النظم الصحية» وأستاذ أعضاء مجلس الجامعة 
للعلوم الإدارية ونظم المعلومات في مدرسة سبيرز للأعمال بجامعة أوكلاهوما الحكومية 
(OSU)‏ وقد عمل قبل مسيرته الأكاديمية loi ble‏ لمدة ه سنوات» في شركة خاصة 
للأبحاث والاستشارات« وضي ژركة College Station j Knowledge Based Systems‏ 
بولاية تكساس. وقد قاد خلال تلك الفترة عدداً من نظم دعم القرار ونظم ا معلومات 
الأخرى ومشاريع البحوث ذات الصّلة التي تموّلها عدة وكالات فيدرالية:» مثل وزارة 
ol öylə! (DoD) gL‏ والفضاء الوطنية )N484(‏ وا معهد الوطني للمعايير 
والتقنية (N181)ء‏ ومنظمة دفاع القذائف البالستية (©82150): ووزارة الطاقة (2©017). 
نشر الدكتور ديلن أكثر من ٠٠١‏ مقالة استعرضها الزملاءء وقد ظهر بعضها في كبرى 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


ُبذة عن المؤلفين 


المجلات مثل علوم القرارء وأنظمة دعم اتخاذ القرارء واتصالات ١۸٥4ء‏ وبحوث الحاسب 
والعمليات» وأجهزة الحاسب في الصناعةء ومجلة إدارة عمليات الإنتاج والذكاء الاصطناعي 
في الطب. والمجلة الدولية للمعلوماتية الطبية» والأنظمة الخبيرة مع التطبيقات» والاتصالات 
IEEE åS‏ وقام مؤخراً بتأليف / المشاركة في تأليف سبعة كتب نصية في مجالات 
واسعة النطاق من تحليلات الأعمال. والتنقيب في البياناتء والتنقيب في النص؛ وذكاء 
الأعمالء وأنظمة دعم القرار. وغالباً ما يُدعى للمشاركة في المؤتمرات الوطنية والدولية 
لعناوين رئيسة عن موضوعات ذات صلة بالتنقيب في البيانات/ النص وتحليلات الأعمال 
ونظم دعم القرار وذكاء الأعمال وإدارة المعرفة. شغل منصب مساعد الرئيس العام 
للمؤتمر الدولي الرابع للحوسبة الشبكية وإدارة المعلومات المتقدمة (6-1 سبتمبر PYA‏ 
في سيول» كوريا الجنوبية) ويشارك بانتظام في رئاسة وتسيير أعمال مختلف مؤتمرات نظم 
المعلومات والمؤتمرات التحليلية. يشغل حاليا منصب رئيس التحريرء محرر أولء محرر 
مشاركء أو عضو في هيثة تحرير لأكثر من عشرة مجلات أكادهية. ويعمل حاليًا رئيس 
تحريرء أو محرر أول أو محرر مشاركء أو عضو مجلس تحرير لأكثر من اثنتي عشرة مجلة 
أكاديمية. وتتمثل اهتماماته البحثية والتعليمية في التنقيب في البيانات والنصء وتحليلات 
الأعمال» ونظم دعم القرارء وإدارة ا معرفةء وذكاء الأعمالء ونمذجة المؤسسات. 

(uel) :Efraim Turban obs ejl! -‏ على درجة ماجستير إدارة الأعمال» والدكتورام 
من جامعة كاليفورنياء بولاية بيركلي) وهو باحث زائر في معهد الباسيفيك لإدارة نظم 
العلومات: بجامعة هاواي. وعمل قبل ذلك ف العديد من الجامعات» مثل: جامعة سيتي 
في هونغ كونغ» وجامعة لي هايء وجامعة فلوريدا الدولية» وجامعة كاليفورنيا الحكومية, 
ولونج بيتشء وجامعة إلينوي الشرقية. وجامعة كاليفورنيا الجنوبية. وقد قام الدكتور 
توربان بتأليف أكثر من ٠٠١‏ ورقة محكمة تم نشرها في المجلات الرائدة مثل: علوم 
الإدارة ونظم المعلومات الإدارية الفصليةء ودعم اتخاذ القرار. كما ألّف ٠١‏ كتاباً مثل 
التجارة الإلكترونية: منظور إداري وتقنية المعلومات للإدارة. وهو أيضاً مستشارٌ لكبرى 
الشركات في جميع أنحاء العالم. وتتمثل مجالات اهتمام د. توربان الحالية في نظم دعم 
القرار على شبكة الإنترنت» والتجارة الاجتماعية» وصُنع القرار بشكل تعاوني. 


YA‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


الفصل الأول 
نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


أهداف التعلّم: 
- فهم الحاجة إلى الدعم المحوسب لصنع القرار الإداري. 
- التعرّف على تطوّر مثل هذا الدعم المحوسب للحالة الراهنة - علم التحليلات / البيانات. 
- وصف منهجية ومفاهيم ذكاء الأعمال. 
- فهم أنواع مختلفة من التحليلات» والاطلاع على تطبيقات مختارة. 
- فهم النظام البيئي للتحليلات لتحديد اللاعبين الأساسيين المتنوعين والفرص الوظيفية. 
إِنَّ بيئة الأعمال (مناخ الأعمال) تتغير باستمرار حتى أصبحت أكثر تعقيدًا. وتخضع ا منظمات» 
سواءً العامة أو الخاصة, لضغوط تجبرها على سرعة الاستجابة للظروف المتغيرة وأن تكون مبتكرةً في 
طريقة عملها. وتتطلب هذه الأنشطة من المنظمات أن تكون مرنةً وأن تتخذ قرارات إستراتيجية 
وتكتيكية وتشغيلية متكررة وسريعةء بعضها معقد جداً. اتخاذ مثل هذه القرارات يتطلب كميات 
كبيرة من البيانات والمعلومات والمعارف المرتبطة بالموضوع, والتي يجب أن تتم معالجتها في كثير 
من الأحيان وفق إطارٍ معين وبشكلٍ عاجل وسريع وعادةً مايتطلب بعض الدعم المحوسب. 
ويتناول هذا الكتابُ استخدام تحليلات الأعمال كدعم محوسب لاتخاذ القرارات الإدارية, 
js‏ على أسس ونظريات دعم القرارء وكذلك على الأدوات والتقنيات التجارية المتاحة» ويقدّم 
هذا الكتاب أساسيات تلك التقنيات وطرق بناء الأنظمة واستخدامها. ونتبع في ذلك نهج EEE‏ 
لتقديم هذه المواضيع: ع05101م:28 Explorations (c5 ,2-Jl) Experiences (gb 2l)‏ 
(الاستكشاف). ويقدّم هذا الكتاب بشكل أساسي استكشاف تقنيات التحليل المختلفة وتطبيقاتها؛ 
لتصبح مصدر إلهام للطالب لتعلم كيفية استخدام المنظمات لتلك التحليلات في اتخاذ قرارات 
أو ميزات تنافسية. ونعتقد أن هذا التعرّض يما يحدث باستخدام التحليلات ونتائجها هو مكون 
رئيسٌ لتعلّم تلك التحليلات. لوصف تلك التقنيات سنقدم أمثلةً لأدوات برمجية مُحدَّدة بالإمكان 
استخدامها لتطوير هذه التطبيقات. وفي وصف الأساليب» نعرض كذلك أدوات البرمجيات 
المحددة التي يمكن استخدامها لتطوير مثل هذه التطبيقات. ولا يقتصر الكتاب على أداة برمجية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ya‏ 


الفصل الأول 


واحدة حتى يتمكّن الطالب من تجريب هذه التقنيات باستخدام أيّ أداة من الأدوات البرمجيات 
المتاحة. ونأمل أن كن هذا التعرض والتجريب تحفيز القراء على استكشاف قدرات هذه 
التقنيات كلَّ في مجاله. ولتسهيل مثل هذا الاستكشاف؛ فإننا سنورد في هذا الكتاب التدريبات 
التي توجّه القارئ إلى شبكة جامعة تيراداتا وغيرها من المواقع؛ والتي تشمل تدريباتٍ قائمةٌ على 
العمل الجماعي إذا لزم الأمر. 
يعرض هذا الفصل التمهيدي مقدمةً للتحليلات بالإضافة إلى نظرة عامة على هذا الكتاب: 
ويحتوي على الأجزاء التالية: 
1-١‏ مقال افتتاحي: التحليلات الرياضية - حدود مثيرة لتعلّم وفهم تطبيقات التحليلات. 
۲-١‏ بيئات الأعمال المتغيرة والاحتياجات المتطورة لدعم القرار والتحليلات. 
7-١‏ تطؤر دعم القرار المحوسب لعلم البيانات/ التحليلات. 
٤-١‏ إطار عمل ذكاء الأعمال. 
0-١‏ نظرة عامة على التحليلات. 
7-١‏ أمثلة على التحليلات في مجالات مختارة. 
۷-١‏ مقدمة موجزة لتحليلات البيانات الضخمة. 
۸-١‏ نظرة عامة على النظام البيئي للتحليلات. 
9-١‏ خطة الكتاب. 
٠١-١‏ مواردء وروابط؛ والاتصال بشبكة جامعة تيراداتا. 
1-١‏ مقال افتتاحي: التحليلات الرياضية - حدود مثيرة لتعلّم وفهم تطبيقات التحليلات: 
إِنَّ تطبيق التحليلات على مشكلات الأعمال من بين المهارات الأساسية التي ستتعلمها في هذا 
الكتاب» ويجري الآن تطبيقٌ العديد من هذه الأساليب لتحسين عملية صُنع القرار في جميع جوانب 
الرياضةء وهو مجالٌ مهم جدًا يُسمَّى التحليلات الرياضية. idg‏ تحليلات الرياضة بمثابة فن وعلم 
جمع بيانات عن الرياضيين والفرق؛ لتكوين رؤى من شأنها تحسينُ القرارات الرياضيةء مثل: تحديد 
اللاعبين الذين سيتم الاستعانة بهم والأجور التي سيتمٌ دفعها لهم» وكيف سيلعبون وكيف سيتمُ 
تدريبهم» وكيفية الحفاظ على صحتهم» ومتى يمكن بيعهم ومتى يعتزلون. وبالنسبة للفرق؛ فإِنَّ 
ذلك ينطوي على قرارات الأعمال» مثل تسعير التذاكرء فضلاً عن القرارات المتعلقة بقائمة اللاعبين 
وتحليل نقاط قوة وضعف ÍS‏ منافس. والعديد من القرارات اليومية المتعلقة باللعبة. 


Y.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


في الواقع إِنَّ التحليلات في مجال الرياضة لها طابعٌ خاص؛ نظراً لأهمية هذا المجال في كونه مجال 
أعمال كبيراً يحقق إيرادات تبلغ 140 مليار دولار أمريي تقريباً بشكلٍ سنوي؛ بالإضافة إلى ٠٠١‏ مليار 
دولار أخرى في الرهانات القانونية و١٠‏ مليار دولار في الرهانات غير القانونية. في عام ١٠١۲م‏ وفقاً 
ممنظمة Pi» W٤60 5٥‏ تم إنفاق ٠۲١‏ مليون دولار فقط على التحليلات (أقل من ٠,١‏ من 
الإيرادات)» ومن ا متوقع أن ينمو الإنفاق معدل جيد ٤.۷ JI Lad‏ مليار دولار بحلول عام ۲۱١۲م‏ 

حظي استخدامٌ التحليلات في مجال الرياضة بشعبية من خلال كتاب (JI Moneyball‏ 445 
Lewis Michael‏ في عام *١٠٠م:‏ وكذلك فيلم بطولة )۴ 84 في عام ۲۰۱۱م والذي عرض فيه 
Bi11y Beane‏ المدير العام لأوكلاند أ استخدام البيانات والتحليلات؛ لتحويل فريق خاسر إلى فريق 
فائز. على وجه الخصوص؛ قام بياي بن بتعيين محلل استخدم التحليلات لصياغة لاعبين قادرين 
على الحصول على قاعدة بدلاً من اللاعبين الذين تميزوا في التدابير التقليدية مثل عمليات الضرب 
أو القواعد المسروقة. هذه الأفكار مكّنتهم من صياغة توقعات تغفل عنها الفرق الأخرى برواتب 
مبدئية معقولة؛ لقد نجحت تلك الأفكار ووصلوا إلى التصفيات في عامي Ys Ys Y Y‏ 

والآن يتم استخدامٌ التحليلات في جميع مناحي الرياضة. ويمكن تقسيمٌ التحليلات ما بين 
المكتب الأمامي والمكتب الخلفيء ويُظهر Tom Davenport 3l: ul Ulis‏ وصفاً جيداً لثلاثين 
مثالاً". وتشمل تحليلاتٌ أعمال المكتب الأمامي تحليل سلوك الجماهير بدءًا من النماذج التنبؤية 
لتجديد تذاكر الموسم ومبيعات التذاكر العادية» إلى توقعات التهديف من قبل المشجعين فيما 
يتعلّق بالفريق والرياضيين والمدربين: واخلّاك. وهذا يشبه إلى حَذَّ كبير إدارة علاقات العملاء 
التقليدية IS JUI All Åg (CRM)‏ من ا مجالات الرئيسة؛ حيث بعد الحدٌ الأقصى 
للراتب أو حدود البعثة جزءًا من المعادلة. 

ويشملٌ استخدام المكاتب الخلفية تحليلٌ كل من الرياضيين الأفراد. وكذلك لعب الفريق. وبالنسبة 
للاعبين الفرديين؛ يتمثل التركيز على نماذج التوظيف وتحليلات الكشافة وتحليلات القوة واللياقة البدنية 


(1) Source: Changing the Game: Outlook for the Global Sports Market to 2015, Price Waterhouse 
Coopers Report, appears at https://www.pwc.com/gx/en/hospitality-leisure/pdf/changing-the game- 
outlook-for-the-global-sports-marketto-2015.pdf. Betting data from  https://www.capcredit.com/ 
how-much-americansspend-on-sports-each-year/. 

(2) Sports Analytics Market Worth $4.7B by 2021," Wintergreen Research Press Release, covered by PR. 
Newswire at http://www.prnewswire.com/news-releases/sports-analytics-market-worth-47-billion- 
by-2021-509869871.html, June 25, 2015. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Y‏ 


الفصل الأول 


وكذلك التنمية» PMs IÑI ialog‏ لتجنّب الإفراط في التدريب والإصابات: وكذلك فإن ارتجاج ا مخ 
من المجالات المهمة في الرياضة. وتشمل تحليلات الفريق الإستراتيجيات والتكتيكات. والتقييمات 
التنافسيةء والخيارات الُْثلى للقائمة في إطارٍ مختلف من الحالات الميدانية أو في الملاعب. وتوضّح 
الأمثلة التوضيحية التالية كيف تستخدم ثلاث منظمات رياضية البيانات والتحليلات لتحسين العمليات 
الرياضيةء بنفس الطريقة التي قامت بها التحليلات بتحسين صناعة القرارات التقليدية في الصناعة. 


مثال١-‏ مكتب الأعمال: 


يعمل ديف وارد محلل أعمال لفريقٍ كبير بلعبة البيسبول للمحترفين» ويركز عمله على العوائد 
وتحليل مبيعات التذاكر سواءً تذاكر موسم كامل أو تذكرة واحدة. بعض الأسئلة التي تخضع 
لمسؤوليته تتضمّن اذا يُجدَّد (أو لا (åa‏ حاملو التذاكر ا موسمية تذاكرهم» وكذلك العوامل التي 
تدفع الجمهور لشراء تذكرة مقعد فردي في آخر لحظة» وأيضاً كيفية تسعير التذاكر. وتشمل بعض 
الأساليب التحليلية التي يستخدمها مكتب 04۷0 إحصاءات بسيطة عن سلوك الجماهيرء مثل الحضور 
العام والإجابات عن أسئلة الاستبيان حول احتمال الشراء مرةً أخرى. ومع ذلك؛ فقد يختلف ما يقوله 
الجماهير عمًا يفعلونه. ويقوم ©1085 بإجراء استبيان المشجعين من خلال المكان المحجوز بلقعد 
التذكرة «الدرجة» ويسأل عن احتمال تجديد تذاكر الموسم. ولكنه عندما يقارن ما يقولونه مقابل ما 
يفعلونه؛ يكتشف اختلافات كبيرة (انظر الشكل .)١-١‏ حيث تبيّن له أن 19“ من المشجعين في مقاعد 
الدرجة الأولى الذين قالوا في الاستبيان أنهم «قد لا يُجدّدون» قد جدَّدوا بالفعل وكوّن هذا بالنسبة 
له do)‏ جيدةً مفادها أنَّ العملاء في الخلايا الخضراء سيقومون على الأرجح بتجديد تذاكرهم؛ لذلك 
يحتاجون إلى جهد أقل في التسويق وصرف الدولارات مقارنة بالعملاء في الخلايا الزرقاء. 


| مؤكد لا محتمل لا ريما Jaina‏ محتمل جدا الطبقة | 
45 69 75 88 52 1 
38 65 70 81 88 2 
|a Bo 76 58 55 1 36‏ 
7B 65 45 25‏ 77 4 | 
25 35 60 70 75 5| 


شكل :1-١‏ تجديد تذاكر الموسم - نتائج الدراسة الاستقصائية 


(3) Sources: Thomas Davenport, "Analytics in Sports: The New Science of Winning; International 
Institute for Analytics White paper, sponsored by SAS, February 2014. On the SAS Web site at: 
http://www.sas.com/content/dam/SAS/en us/doc/whitepaper2/iia-analytics-in-sports-106993.pdf. 
(Accessed July 2016). 


Y‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


ولكن هناك عدة عوامل تؤثرٌ على سلوك الجمهور فيما يتعلق بشراء التذاكر وخاصةً السعر؛ 
مما يستدعي إجراء إحصاءات أكثر تطؤراً وتحليل بيانات. في كلا المجالين وخصوصاً تذاكر اللعبة 
الواحدة؛ يقود ديف استخدام التسعير الديناميي؛ لينقل المجال من التسعير الثابت البسيط 
المعتمد على موقع المقعد إلى التسعير الديناميي اليومي المتأثر بالصعود والهبوط. يُعتبّر هذا 
المجال مجالًا بحثيًا ثريا للعديد من الفرق الرياضية من شأنه زيادة فرص تحسين إيراداتهم. على 
سبيل اللثال: عند التسعير يجب مراعاة سجل الفريق ومن يلعبون وتواريخ وتوقيت المباريات 
التي يلعب فيها اللاعبون النجوم لكل فريق» وتاريخ تجديد تذاكر الموسم أو شراء تذاكر فردية. 
بالإضافة إلى عوامل أخرى مثل مكان المقعد. وعدد المقاعد. والمعلومات التي تواكب وقت اممباراة 
مثل الازدحام المروري وقت المباراة وحتى الطقس. انظر الشكل .7-١‏ 





عدد كل التجوم فى قائمة الخصم ١ E‏ 


شكل :۲-١‏ التسعير الحركي للعمل السابق - دوري البيسبول الأساسي 

(s‏ من هذه العوامل أكثر أهميةً؟ وما مقدار أهميته؟ اعتماداً على الخبرة الإحصائية الواسعة؛ 
قام ديف ببناء نماذج انحدار لاستخلاص العوامل الرئيسية التي تقودٌ تلك السلوكيات التاريخية 
وقام بإنشاء 2315 لتحديد كيفية إنفاق موارد التسويق لدفع الإيرادات. كما قام بإنشاء نماذج 
مُخصّصة لحملة التذاكر الموسمية لتحديد شرائح العملاء الذين سيقومون أو لن يقوموا بالتجديد. 
أو مَنْ لا يستطيعون اتخاذ قرار مناسب ومن خلال ذلك يمكن القيامٌ بحملات تسويقية أكثر 
دقة. وبالإضافة إلى ذلك؛ يقوم بإجراء إحصاء للتوقعات المتعلقة بالتهديف من خلال تعليقات 
الجمهور مثل التغريدات التي تساعده على تقسيم المشجعين إلى شرائح ولائية مختلفة. وتساعد 
الدراسات الأخرى عن دوافع حضور لعبة فردية إدارة التسويق على فهم تأثير الهدايا مثل القمصان 
الرياضيةء أو اقتراحات حول أماكن نشر الإعلانات التلفزيونية الفورية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ع 











الفصل الأول 


وبالإضافة إلى الإيرادات؛ يوجد العديدٌ من المجالات التحليلية الأخرى التي يعمل عليها فريق 
Lg Dave‏ $ ذلك التسويقء وعوائد إعلانات الراديو والتليفزيون وتقديم البيانات إلى المدير 
العام بشأن المفاوضات على الراتبء ومشاريع التحليلات الخاصة بالنظر إلى الحَذَّ الأقصى للراتب» 
وفعالية الترويج بما في ذلك القنوات الإعلانية» والتوعية بالعلامة التجارية, وكذلك تحليلات الشركاء. 







12.21,30,31,32 











نسبة الجري:15.3896 
نسبة التمرير: ,84.6290 

















إجمالى اللعبات:66 
نسبة الجري: 4.55% 
نسبة التمرير: 95.4596 


إجمالى اللعبات:162 
نسبة الجري:50.62% 
نسبة التمرير: 49.38% 











شكل Y-‏ شجرة القرارات المتتالية لتنفيذ أو تمرير اللعبات 

مثال؟- المدرب «اءع2ه00 عط]1: 

بوب بريدلوف مدربٌ كرة قدم لفريق إحدى الكليات الكبيرة ويُركّز بشكلٍ كاملٍ على الفوز 
با مباريات. يركز بوب على استقطاب أفضل اللاعبين في المدارس الثانوية» وتطوير مهاراتهم 
لتتناسب مع أنظمة هجومه ودفاعهء وكذلك الحصولٌ على أقصى جهد ممكن منهم في أثناء 
المباريات. يقع تحت مسؤولياته أيضاً الإجابة عن أسئلة مثل: مَنْ سنستقطبُ من اللاعبين؟ ما 
التدريبات التي تساعدٌ على تطوير مهاراتهم؟ ما مدى صعوبة دفع وتحفيز لاعبينا؟ وما نقاط 
قوة وضعف المنافسين؟ وكيف هكننا معرفة أو التعرّف على اتجاه لعبهم؟ 

وخسن الحظ؛ استعان فريقه بخبيرة عمليات الفريق الجديدة دار برناكء المتخصّصة في 
مساعدة المدربين في اتخاذ القرارات التكتيكية» وتعمل دار مع فريق من الطلاب المتدربين الذين 
يقومون بإجراء تحليلات للخصم باستخدام فيلم ال مباراةء والذي يقوم ا مدرب بالتعليق عليه لإنشاء 


ve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 




















نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


نموذج شجرة القرارات المتتالية كما في الشكل ٠-١‏ للتنبؤ بما إذا كانت المباراة التالية ستكون مباراة 
جري أو تمرير. أمّا بالنسبة للمنسق الدفاعي؛ فقد قاموا ببناء خرائط حرارية كما في الشكل 6-١‏ 
لكلّ هجوم للخصم لتوضيح مَيْلِهِم إلى التمرير إلى اليسار أو اليمين وإلى مناطق التغطية الدفاعية. 
وأخيراً؛ قاموا بإجراء تحليلات لبعض السلاسل الزمانية كما في الشكل ١-ه‏ على المباريات القوية 
(تُعرف على أنها الحصول على ١1‏ تمريرة صحيحة أو الجري لمسافة ١١‏ ياردة أو أكثر). لكل مباراق 
يقارنون نتائج التحليل بتشكيلاتهم الدفاعية وهجوم الفرق المنافسة للساعدة المدرب بريدلوف 
على التفاعل بسرعة أكبر مع التحؤلات في أثناء المباراة سيتم شرح هذه الأساليب التحليلية بشكلٍ 
مفصل في الفصول الثاني والخامس والسابع. 








1 
25:5 mm ves E 
اجمالي:35‎ d 14 اجمالي: نف‎ 
T14% e ne E 
1: ساخن :1 ساخن‎ 











شكل :6-١‏ تحليل منطقة الخريطة الحرارية للتمريرات 


Jis el Ja has‏ الجديدة التي تقوم بها 295 بناء نماذج أفصل لآمتقظاب الرياضيين.فن 
المدارس الثانوية. فعلى سبيل المثال؛ يقدّم فريق العمل في كلّ عام منحاً دراسيةً لثلاثة طلاب 
يتم اختيارهم للفريق. أما بالنسبة ل ة4 فإن اختيار أفضل اللاعبين لا يقتصر على المقاييس 
البسيطة مثل مدى سرعة اللاعبين» ومدى ارتفاع قفزاتهم: وطول أذرعهم؛ بل يتخطاها إلى معايير 
جديدة. مثل مدى سرعة تدوير رؤوسهم لالتقاط التمريرات» وما أنواع وأوقات رد الفعل للاعب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yo‏ 














الفصل الأول 


على المؤثرات المتعددةء ومدى دقة تنفيذه للتمريرات. وتّنشر بعض أفكار دار في توضيح هذه 
المفاهيم على موقع e TUN‏ شبكة الإنترنت؛ ابحù BSI Case of Precision Football je‏ . 





شكل :0-١‏ تحليل السلاسل الزمنية للعبات الساخنة 
مثال- المدرب :The Trainer‏ 


يعمل الدكتور دان جونسون مدرباً لفريق كرة القدم بكلية المرأة لمساعدة اللاعبات على 
الحفاظ على صحتهن وتقديم المشورة للمدربين بخصوص قدرة التحمُل لكل لاعبة خلال 
التدريبات. euo US‏ جونسون برفاهية اللاعبات بما في ذلك مقدار النوم ووقت الراحة لكلّ 
لاعبة بين فترات التدريب الثقيلة والخفيفة, والهدف من ذلك التأكّد من استعداد اللاعبات للعب 
بأقصى قدرٍ ممكن من الكفاءة في أثناء المباريات. 

chodi gibda‏ وبسبب استخدام الأجهزة الرياضية المتطوّرة؛ كان هناك المزيدُ من البيانات 
التي مكّنَت الدكتور s Dan‏ التحليل. فقد كانت اللاعبات يستخدمن سُترات تحتوي على أجهزة 
الاستشعار يمكن من خلالها قياسٌ الأحمال الداخلية؛ مثل ضربات القلب» ودرجة حرارة الجسم 
ومُعدلات التنفس علاوةً على سترات التسارع التي تقيس الأحمال الخارجيةء مثل العدو لمسافات 
والسرعات وكذلك التسارع والتباطؤ. ومن ثم التعرّف على اللاعبات LII‏ يُعطين أقصى جهد 
خلال التدريبات ومن لَسْنَ كذلك. 


y‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


وينصبٌ تركيرُ جونسون حاليًا على الأبحاث التي تساعده في التنبؤ بإصابات اللاعبات وكيفية 
الوقاية منها (الشكل .)1-١‏ ويمكن أن توفّر تدريبات بسيطة مثل الوقوف على ساق واحدة 
وجلوس القرفصاء واختبار إمساك ساق ثم السَّاق الأخرى مع وجود فرق نقاط أكثر من *٠١‏ رؤى 
مفيدة لجونسون حول نقاط قوة وضعف الجسم كما في شكل ./-١‏ فإذا أصيبّت لاعبة خلال 
المباراة يمكن للمدرب إجراءٌ اختبار جانبي لرد فعل تحفيزي على جهاز محمولء والتي تضيف إلى 
بروتوكولات الصدمات التقليدية. وتظهر أجهزة استشعار النوم مَنْ الذي يحتاج إلى الحصول على 
راحة كافية (أو الذين سهروا طوال الليل). كما استعان د. دان بمختبر التصوير بالرنين المغناطيسي 
في الحرم الجامعي للقيام مسح الدماغ الدوري لإظهار أي الرياضيين عُرضةً للإصابة بإصابات الدماغ. 

















شكل :۷-١‏ اختبار قرفصاء الساق الواحدة 
شكل :1-١‏ نماذج إصابات كرة القدم© -اختبان قوة الجسم الأساسية 


(5) "إصابات كرة القدم للسيدات" المركز القومي لتقارير بحوث الإصابات الرياضية الكارثية zlo Shs gls} ex NCAA‏ 
الإصابات الرياضية N۸4‏ بواسطة مركز sواهاه0‏ لأبحاث الإصابات الرياضية والوقاية منها بالتعاون مع الرابطة القومية 
لرياضة الجامعات وإصابات رياضة 51078. تصدر xà‏ 

https://www.ncaa.org/sites/default/fles/NCAA 'W. Soccer Injuries WEB.pdf 
(V (تم الوصول إليها في نوفمير‎ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Y‏ 





الفصل الأول 


أسئلة على هذه الأمثلة: 

-١‏ ما العوامل الثلاثة التي قد تكون جزءً! من 221 لتجديد تذكرة الموسم؟ 

Gs -Y‏ الأساليب التي يمكن أن تستخدمها فرق كرة القدم للقيام بتحليل الخصم؟ 

*- كيف يمكن للأجهزة القابلة للارتداء تحسين صحة وسلامة اللاعب؟ وما أنواع التحليلات 
الجديدة التي يمكن أن يستخدمها المدربون؟ 

-٤‏ ما استخدامات التحليلات الأخرى التي يمكنك تصورها في الألعاب الرياضية؟ 


ماذا يمكننا أن نتعلّم من هذه المقالة القصيرة: 

las oe I uso‏ الأعمال في المكاتب الأمامية والمدربين وخبراء الأداء؛ فإن هناك العديد من 
الأشخاص الآخرين في الألعاب الرياضية يستخدمون البيانات» بدءًا من لاعبي الجولف الذين 
يقيسون ظروف التربة والأرض لبطولات 264 وحكام البيسبول وكرة السلة الذين يتم تقييمهم 
بناءَ على قراراتهم الصحيحة وغير الصحيحة التي يجرونها. وفي الواقع؛ يصعب العثور على مجال 
من مجالات الرياضة لا يتأثر بتوفر المزيد من البيانات» وخاصةً من أجهزة الاستشعار. 

إِنَّ المهارات التي ستتعلمها في هذا الكتاب لتحليل الأعمال تنطبق على الرياضة. فإذا كنت 
ترغب في التعمق في هذا ا مجال؛ فإننا نشجعك على الاطلاع على قسم تحليلات الرياضة بشبكة 
جامعة تيراداتا (11011). وهي مصدرٌ مجاني للطلاب وأعضاء هيئة التدريس. وفي هذا الموقع؛ 
سوف تجد وصفاً لما يجب قراءته لمعرفة المزيد عن التحليلات الرياضية» ومجموعات من الأماكن 
التي يمكنك العثور بها على مجموعات البيانات المتاحة للجمهور للتحليل؛ فضلًا عن أمثلة لمشاريع 
الطلاب في تحليلات الرياضة ومقابلات المهنيين الرياضيين الذين يستخدمون البيانات والتحليلات 
للقيام بوظائفهم. 
7-١‏ بيئات الأعمال المتغيرة والاحتياجات المتطورة لدعم القرار والتحليلات: 

توضّح المقالة الافتتاحية كيف يمكن للصناعة بأكملها أن تستخدم تحليلات لوضع تقارير lie‏ 
يحدثء والتنبؤ بما مكن أن يحدث» ومن ثم اتخاذ القرارات أيضاً لتحقيق أفضل استفادة من 
Sources: Business Scenario Investigation BSI: The Case of Precision Football (video). (Fall 2015).‏ )4( 


Appears on http://www.teradatauniversitynetwork.com/About-Us/Whhats-New/BSI-Sports-Analytics- 
Precision-Football//, Fall 2015. (Accessed September 2016). 


Y^‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


الوضع القائم. وتتطلّب هذه الخطوات من المنظمة جمع وتحليل المخزون الضخم من البيانات. 
ومن الاستخدامات التقليدية في وظائف كشوف المرتبات وإمساك الدفاترء توغلت النظم ا لمحوسبة 
الآن في مجالات إدارية معقدة تتراوح بين تصميم وإدارة المصانع الآلية إلى تطبيق أساليب تحليلية 
لتقييم عمليات الاندماج والاستحواذ المقترحة. ويعرف جميع المديرين التنفيذيين تقريبًا أن تقنية 
المعلومات ذات أهمية حيوية لأعمالهم ويستخدمون تقنيات المعلومات على نطاق واسع. 
وقد انتقلت تطبيقات الحاسوب من أنشطة معالجة المعاملات ورصدها إلى تحليل المشكلات 
وتطبيقات الحلولء وتم القيامٌ بالكثير من الأنشطة باستخدام التقنيات المستندة إلى السحابة» التي 
تم الوصول إليها في كثير من الحالات من خلال الأجهزة المتنقلة. إن أدوات التحليل وذكاء الأعمال 
مثل مستودع البيانات» والتنقيب ف البيانات» وا معالجة التحليلية الفورية (01.45) ولوحات 
ا معلومات» واستخدام الأنظمة القائمة على السحابة لدعم القرار؛ هي أهم عناص الإدارة الحديثة 
في الوقت الحاضر. وأصبح من المحتمل أن يكون لدى المديرين أنظمة معلومات وشبكات (سلكية 
أو لاسلكية) عالية السرعة لمساعدتهم في مهمتهم الأكثر أهمية وهي اتخاذ القرارات. وفي كثير من 
الحالات» يتم تنفيذ مثل هذه القرارات آلياً بشكل روتيني؛ مما يلغي الحاجة إلى أيّ تدخل إداري. 
وبالإضافة إلى الزيادة الواضحة في قدرات المكوّنات المادية والبرمجيات والشبكات؛ ساهمت 
بعض التطورات بشكلٍ واضح في تسهيل زيادة دعم القرارات والتحاليل بعدة طرق» منها: 
- التواصل والتعاون الجماعي: يتم اتخاذ العديد من القرارات اليوم من قبل ا مجموعات التي قد 
يكون أعضاؤها في مواقع مختلفة. وتستطيع ال مجموعات التعاون والتواصل بسهولة باستخدام 
أدوات التعاون وكذلك الهواتف الذكية في كلّ مكان. ويكتسب التعاون أهميةً خاصة على 
امنداد سلاسل التوريد؛ إذ يجبُ على الشركاء تبادل المعلومات مع المورّدين والعمال بصفة 
مستمرة. وقد يكون تجميع مجموعة من صانعي القرارء وخاصةً الخبراء» في مكان واحد 
باهظ التكلفة. وبالتالي يمكن لنظم المعلومات أن تحسّن عملية التعاون في مجموعة ما وتمكن 
أعضاءهها من التواجد في مواقع مختلفة (لتوفير تكاليف السفر). والأهم من ذلك؛ أن هذا 
التعاون في سلاسل التوريد يسمح للمصنّعين بمعرفة أنماط التغير في الطلب في الوقت المناسب» 
وبالتالي يتفاعلون OUS ga‏ السوق بشكل أسرع. 
)0( «إصابات كرة القدم للسيدات» المركز القومي لتقارير بحوث الإصابات الرياضية الكارثية. 2/044. يتم إنتاج أوراق واقع الإصابات 
الرياضية N0۸44‏ بواسطة مركز اهاه لأبحاث الإصابات الرياضية والوقاية منها بالتعاون مع الرابطة القومية لرياضة الجامعات 
وإصابات رياضة https://www.ncaa.org/sites/default/files/NCAA. 'W Soccer Injuries WEB.pdf. à ju: .STOP‏ 
(تم الوصول إليها في نوفمير 7017). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ya‏ 


الفصل الأول 


- تحسين إدارة البيانات: تنطوي العديدٌ من القرارات على حسابات مُعقدة تعتمد على بيانات 
مخزنة في مستودعات مختلفة في أماكن ذاخل وربما خارج المنظمة. وقد تتضمّن البيانات النص 
والصوت والرسومات والفيديوء وقد تكون هذه الصيغ بلغات مختلفة. وفي كثيرٍ من الأحيان 
يكون من الضروري نقل البيانات بسرعة من مواقع بعيدة. ومن خلال أنظمة اليوم يمكن 
البحث عن البيانات اللازمة وتخزينها ونقلها بسرعة وبتكلفة اقتصادية وأمان وشفافية. 

- إدارة مستودعات البيانات العملاقة والبيانات الضخمة: تحتوي مستودعات البيانات الضخمة 
Walmart lau (I es Ua‏ على كميات هائلة من البيانات. وتتوفر أساليب خاصةء ا في 
ذلك الحوسبة المتوازية» Hadoop/Sparks‏ ومثيلاتها لتنظيم البيانات والبحث فيها والتخلص 
منها. وتتناقص تكاليف تخزين والتنقيب في البيانات بسرعة» هذه التقنيات تندرجٌ تحت فئة 
واسعة من البيانات الضخمة التي تم جمعها من مصادر متنوعة وبأشكال مختلفةء جمع تلك 
البيانات يعطي رؤية كاملة للأداء التنظيمي هذه الرؤية م تكن ممكنةً في الماضي. 

- الدعم التحلياي: ومع المزيد من تقنيات البيانات والتحليل» مكن تقييم ا مزيد من البدائلء 
ويمكن تحسين التنبؤات» ويهمكن إجراء تحليل المخاطر بسرعة» كما هكن جمح آراء الخبراء 
(وبعضهم في مواقع نائية) بسرعة وبتكلفة منخفضة. ويمكن استخلاص الخبرة حتى بشكلٍ 
مباشر من النظم التحليلية. وباستخدام هذه الأدوات» يستطيعٌ صانعو القرار إجراء محاكاة 
معقدة والتحقق من العديد من السيناريوهات المحتملةء وتقييم الآثار المتنوعة بسرعة 
واقتصادية. وهذا بالطبع هو محور عدة فصول في هذا الكتاب. 

- التغلب على الحدود ا معرفية في معالجة وتخزين المعلومات: وفقاً ل )1977( 3I sSimon‏ ]5 
للعقل البشري قدرةً محدودةً على معالجة وتخزين ال معلومات. ويجد الناس أحياناً صعوبة في 
استرجاع واستخدام المعلومات دون أخطاء بسبب حدودهم المعرفية. ويشير مصطلحٌ الحدود 
المعرفية إلى أن قدرة الفرد على حل المشكلات تكون محدودةً عندما تكون هناك حاجة إلى 
مجموعة واسعة من المعلومات والمعرفة المتنوعة. فالنظم المحوسبة تمكن الناس من التغلّب 
على حدودهم الإدراكية من خلال الوصول السريع ومعالجة كميات هائلة من المعلومات المخزنة. 

- إدارة المعرفة: وقد جمعت المنظماتُ مستودعاتٍ alius‏ من المعلومات عن عملياتها الخاصة: والعملاه» 
والإجراءات الداخليةء وتفاعلات الموظفينء وما شابه ذلك. من خلال الاتصالات المهيكلة وغير المهيكلة 
التي تجري بين مختلف أصحاب المصالح. وأصبحت نظم إدارة ا معرفة بالنسبة للمديرين مصادر 
للدعم الرسمي وغير الرسمي لاتخاذ القرارات» وإن كانت لا تسمى أحياناً بنظم إدارة المعرفة. التقنيات 
IBM Watsons osa! J.lo3 Jis‏ جعلت من الممكن استخراج قيمة من هذه المستودعات. 


t‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


المعلومات في Lög GÍ‏ ومن أيّ مكان» وتحليل وتفسير ذلك والتواصل مع المعنيين. وربما كان 
هذا أكبر تغيير حدث في السنوات القليلة الماضية. فالسرعة التي تحتاجٌ إلى معالجة المعلومات 
وتحويلها إلى قرارات قد غيرت بالفعل توقعات المستهلكين والشركات على حدٌ سواء. Sl as‏ 
كل ذلك إلى استخدام الدعم المحوسب للقرارات منذ أواخر الستينيات» وبصفة خاصة منذ 
منتصف التسعينيات. وقد أتاح نمو التقنيات المتنقلة ومنصات وسائل التواصل الاجتماعي 
والأدوات التحليلية مستوّى مختلفاً من دعم نظم المعلومات (15) للمديرين. ولا يمتد هذا النمو 
في توفير الدعم المعتمد على البيانات لأي قرار إلى المديرين فحسب ولكن أيضاً إلى المستهلكين. 
وسنقوم أولاً بدراسة لمحة عامة عن التقنيات التي قمّت الإشارة إليها على نطاق واسع باسم ذكاء 
الأعمال. من هذا المنطلق سوف نقوم بتوسيع آفاقنا لتقديم أنواع مختلفة من التحليلات. 


أسئلة مراجعة على القسم :7-١‏ 

-١‏ اذكر بعض الاتجاهات الرئيسة الموجهة بالنظام والتي عرَرّت عملية صنع القرار التي تدعمها 
نظم المعلومات JI "IS"‏ مستوى جديد؟ 

۲- اذكر بعض قدرات نظم المعلومات التي مكن أن تسهل اتخاذ القرارات الإدارية. 

-٣‏ كيف هكن للحاسوب المساعدة $ dal‏ على الحدود الإدراكية للإنسان؟ 


"-١‏ تطور دعم القرار المحوسب لعلم البيانات/ التحليلات: 

يبي الجدول الزّمني الوارد في الشكل (6-1) المصطلحات المستخدمة لوصف التحليلات منذ 
السبعينيات. وخلال السبعينيات؛ كان التركيرُ الأساسي لنظم المعلومات في دعم القرارات على 
تقديم تقارير دورية منظمة يمكن للمدير استخدامّها في اتخاذ القرارات (أو تجاهلها). وقد بدأت 
الأعمال في إنشاء تقارير روتينية لإبلاغ صانعي القرار (المديرين) بما حدث خلال فترة سابقة (يوم 


المصدر والاعتمادات: لقد قام الدكتور #»3دمدء5 2806 بتلك المساهمة. والذي تقاعد بعد ١6‏ عاماً من التطوير 
والتسويق المتقدمين في تيراداتاء وقد ظل في مجلس المستشارين بشبكة جامعة تيراداتا؛ ليقضي فترة تقاعده في مساعدة 
الطلاب وأعضاء هيئة التدريس على معرفة المزيد عن التحليلات الرياضية. تم تصميم صور كرة القدم (الأشكال 7-١‏ 
0-15( بواسطة طلاب الدراسات العليا عمدنآ ]5 ودهدمه5 دامءه[ بجامعة أوكلاهوما الحكومية» كجزء من مشروع 
طلابي في ربيع عام 17١7م.‏ وتم اقتباسٌ صور التدريب (الأشكال 1-١‏ و١-۷)‏ من الصور التي قدّمها كلّ من البروفيسور 
Gary Wilkerson‏ من جامعة تينيسي في تشاتانوجا والبروفيسور „ög äzal o» Ashish Gupta‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £V‏ 


الفصل الأول 


أو أسبوع. أو شهرء أو ربع سنة). وعلى الرغم من أنه كان من المفيدٍ معرفة ما حدث في الماضي؛ 
فإنَ المديرين كانوا بحاجة إلى أكثر من ذلك؛ لأنهم يحتاجون إلى مجموعة متنوعة من التقارير 
على مستويات مختلفة من التفصيل لفهم ومعالجة الاحتياجات والتحَدَّيات المتغيرة للشركة 
بشكل أفضل. وعادةً ما ehi oia GÀ‏ المعلومات الإدارية (3115). في أوائل السبعينيات» 
وقد طرح 56061-31011023 المفاهيم الرئيسة لنظام دعم القرار 255. وقد عرفت نظم دعم 
القرار 17555 بأنها «أنظمة حاسوبية تفاعلية» تساعد صُناع القرار على استخدام البيانات والنماذج 
لحل المشكلات غير المهيكلة» Gorry‏ و(1971) 560]1-8101102. وفيما ياي تعريف كلاسيكي 
آخر ل :Scott-Morton (1978)5 Keen 4233 gil DSS‏ 


تجمع نظم دعم القرار بين الموارد الفكرية للأفراد مع قدرات الحاسب؛ لتحسين 
نوعية القرارات. وهو نظام دعم قائم على الحاسوب لصناع القرار الإداريين الذين 


>- ذكاء الأعمال نظم معلومات تنفيذية المؤسسة ١‏ نظم دعم القرار 


شكل :۸-١‏ تطور دعم القرار وذكاء الأعمال والتحليلات 

لاحظ أنَّ مصطلح «نظام دعم القرار»» مثل نظام المعلومات الإدارية والعديد من المصطلحات 
الأخرى في مجال تقنية المعلومات. هو تعبيرٌ خالٍ من المحتوى (بمعنى أنه يعني أشياء مختلفة 
لأشخاص مختلفين). ولذلك؛ لا يُوجَّد تعريف مقبول عالليًا لنظام دعم القرار. 

وخلال الأيام الأولى من التحليلات؛ غالبًا ما يتم الحصول على البيانات من خبراء المجال 
باستخدام العمليات اليدوية ssl)‏ المقابلات والاستقصاءات) لبناء النماذج الرياضية أو المعرفة 
القائمة على حَلّ مشكلات التحسين المقيّدة. وكانت الفكرة هي تحقيق الأفضل باموارد المحدودة. 
uâ b oleg‏ نماذج دعم القرار هذه باسم بحوث العمليات (08). ولقد تمت معالجة 
المشكلات التي كانت معقدةً إلى درجة لم يكن يمكن حلها على النحو الأمثل (باستخدام أساليب 


ey‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


البرمجة الرياضية الخطية أو غير الخطية) باستخدام أساليب الاستدلال مثل نماذج المحاكاة. 
(سنقدّم هذه التحاليل الوصفية لاحقاً في هذا الفصل وبتفاصيل أكثر في الفصل السادس). 

وفي أواخر السبعينيات وأوائل الثمانينيات؛ وبالإضافة إلى نماذج بحوث العمليات الناضجة 
التي كانت تُستخدم في العديد من الصناعات والنظم الحكومية؛ ظهرت مجموعةٌ جديدةٌ ومثيرة 
من النماذج» مثل: نظم الخبراء القائمة على القواعد. وقد بشَّرتَ هذه الأنظمة بحصر معارف 
الخبراء في شكل تستطيع الحواسيب معالجته (من خلال مجموعة من القواعد أو الاستدلالات)؛ 
بحيث يمكنُ استخدام هذه القواعد للتشاور بنفس الطريقة التي يستخدمها خبراء ا مجال لتحديد 
مشكلة مهيكلة ووصف الحلّ الأكثر احتمالًا. وقد سمحت النظم الخبيرة 855 بتوفير الخبرة 
النادرة عندما يلزم الأمر؛ وذلك باستخدام نظام دعم القرار 155 «الذي». 

ولقد شهدت الثمانينيات تغيرًا كبيرًا في طريقة استحواذ المنظمات على البيانات المتعلقة 
بالأعمال التجارية. وكانت الممارسة القديمة تتمثل في وجود عدة نظم معلومات مُفكّكة مُصمّمة 
خصيصًا لتجميع بيانات المعاملات لمختلف الوحدات أو الوظائف التنظيمية (مثل: المحاسبة, 
والتسويق: والمبيعات. والتمويل؛ والتصنيع). وفي الثمانينيات؛ تمّ دمج هذه الأنظمة كنظم 
معلومات على مستوى المؤسسة التي نسميها الآن نظم تخطيط موارد المؤسسة (ERP)‏ وتم 
استبدالٌ مخططات تمثيل البيانات القديمة المتسلسلة وغير المعيارية بأنظمة إدارة قواعد البيانات 
العلائقية (1108114). وقد أتاحت هذه النظم تحسين الحصول على البيانات وتخزينهاء فضلًا عن 
العلاقات بين حقول البيانات التنظيمية مع انخفاض ملحوظ في تكرار ا معلومات. 

وبرزت الحاجةٌ إلى نظم إدارة قواعد البيانات العلائقية (/81211) ونظم تخطيط موارد ا مؤسسة 
(۸۳) عندما أصبحت سلامة البيانات واتساقها مشكلة؛ مما أعاق بشكلٍ sS‏ فعالية الممارسات 
التجارية. وبتخطيط موارد ا مؤسسات؛ يتم جمعٌ كلّ البيانات من جميع أركان المؤسسة ودمجها 
في مخطط ثابت؛ بحيث يكون لكلّ جزء من المنظمة حقٌ الوصول إلى نسخة واحدة من الحقيقة 
متى لزم الأمر. وبالإضافة إلى ظهور أنظمة تخطيط موارد المؤسساتء أو ربما بسبب هذه الأنظمة؛ 
أصبح إعداد تقارير الأعمال ممارسة تجارية حسب الطلبء أو حسب الحاجة. ويمكن لصناع القرار 
أن يُقرّروا متى يحتاجون أو يريدون إنشاء تقارير متخصصة لتقحَّي المشكلات والفرص التنظيمية. 

وفي التسعينيات» col‏ الحاجة إلى إعداد تقارير أكثر تنوعًا إلى تطوير أنظمة المعلومات 
التنفيذية (تمّ تطويرُ نظم المعلومات التنفيذية 18155 ونظام دعم القرار خصيصًا للمديرين 
التنفيذيين واحتياجاتهم من اتخاذ القرار) وقد صُمّمت هذه الأنظمة على شكل لوحات بيانية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Y‏ 


الفصل الأول 


وبطاقات قياس؛ بحيث يمكن أن تكون بمثابة عروض جذَّابة بصريًا مع التركيز على أهمٌ العناصر 
التي يمكن لصانعي القرار من خلالها تتبّع مؤشرات الأداء الرئيسة. ولجعل هذا التقرير أكثر 
تنوعًا مع الحفاظ على سلامة المعاملات لنظم ال معلومات التجارية؛ كان من الضروري إنشاء طبقة 
البيانات المتوسطة المعروفة باسم مستودعات البيانات (10117) كمستودع لدعم تقارير الأعمال 
وصّنع القرار تحديدًا. وخلال 3s‏ قصير جدًا؛ اعتمدت معظمٌ الشركات الكبيرة والمتوسطة 
الحجم مستودعّ البيانات كمنصة لصُنع القرار على مستوى المؤسسة. وحصلت لوحاث المعلومات 
وبطاقات الأداء على بياناتها من مستودعات البيانات (2117)؛ وبذلك تحسّنّت كفاءة أنظمة 
المعاملات التجارية التي يُشار إليها في معظمها بأنظمة تخطيط موارد المؤسسة (815). 

وف العقد الأول من القرن العشرين؛ بدأ يُطلّق على الأنظمة القائمة على مستودعات البيانات 
اسم «أنظمة ذكاء الأعمال». ومع ازدياد كمية البيانات الطولية المتراكمة في مستودعات البيانات؟ 
كان لا بُدَّ أن تواكب قدرات الأجهزة والبرمجيات الاحتياجات المتطورة والسريعة التغيّر لصانعي 
القرار. وبسبب السوق التنافسية المعويلة؛ يحتاج صانعو القرار إلى استيعاب المعلومات الحالية 
في قالب سهل الفهم لمعالجة مشكلات الأعمال والاستفادة من فرص السوق في الوقت المناسب. 
وفي حين e‏ تحديث البيانات في مستودعات البيانات بشكلٍ دوري؛ فإنها لا تعكس أحدث 
المعلومات. va lali‏ على هذه المشكلة المتعلقة بوقت scs‏ إلى المعلومات؛ طوّر مُورّدو 
مستودعات البيانات نظامًا لتحديث البيانات بشكل أكثر تواترًا؛ مما أذَى إلى الاستيداع في الوقت 
اللقااسب للببانات: :والذي يخقلف عن 'المتهج'السابق ق التخزين من خلال اعثماة Egiat dalia‏ 
البيانات على أساس التحديث المطلوب لعناصر البيانات (أيْ: ليس JS‏ عناصر البيانات تحتاج 
إلى تحديث بشكل فوري). إِنَّ مُستودعَات البيانات ضخمةٌ جداً وهي ميزة هائلة. وأصبح من 
الضروري «استخراج» البيانات الخاصة بالشركة؛ من أجل «اكتشاف» المعلومات الجديدة والمفيدة 
لتحسين عمليات وممارسات الأعمال ومن ثم مُصطلحَيْ التنقيب في البيانات والتنقيب في النص. 

ومع تزايد حجم البيانات وأصنافها؛ ظهرت الحاجة إلى المزيد من التخزين وقوة المعالجة. 
وعلى الرغم من أنَّ الشركات الكبيرة لديها الوسائل اللازمة ملعالجة هذه المشكلة؛ فإنَّ الشركات 
الصغيرة الحجم تحتاج إلى نماذج أعمال أكثر قابليةَ للإدارة المالية. وقد أذدَّت هذه الحاجة إلى 
نماذج الخدمات الموجّهة نحو الخدمة والبرامج والبنية التحتية كخدمة تحليل الخدمات. وبالتالي؛ 
cai‏ الشركات الصغيرة من الوصول إلى إمكانيات التحليلات حسب الحاجةء وتدفع فقط مقابل 
ما استخدموه» بدلاً من الاستثمار المالي في موارد الأجهزة والبرامج الحاسوبية. 

ple dias‏ ١٠١۲م‏ وحتى الآن» ونحن نشهد نقلةٌ نوعية أخرى في طريقة رَصْد البيانات واستخدامها. 
وبسبب انتشارٍ استخدام الإنترنت على نطاق واسع؛ ظهرت وسائلٌ جديدة لتوليد البيانات مثل بطاقات 


ع ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


تعریف ترددات الراديو [۸۴12]ء وعدادات الطاقة الرقميةء وسجلات النقر عبر الإنترنت» والأجهزة 
امنزلية الذكيةء ومُعدَّات ال مراقبة الصحية القابلة للارتداء» Leyg‏ كان أكثرها أهميةً الشبكات الاجتماعية 
والتي آذت إلى ظهور بيانات غير مهيكلةء هذه البيانات غنية بالمحتوى؛ ولكنها صعبة التحليل من 
ناحية البرمجيات والأجهزة على حَذَّ سواء. وفي الآونة الأخيرة؛ ظهر مصطلح البيانات الضخمة ليسلّط 
الضوء على التحَدَّيات التي جلبتها لنا هذه البيانات الجديدة. وقد تمّ تطويرٌ العديد من التحسينات 
في كلّ من الأجهزة (فعلى سبيل المثال: المعالجة المتوازية على نطاق واسع مع الذاكرة الحسابية الكبيرة 
جدًا ونظم الحوسبة متعددة المعالجات المتوازية للغاية) والبرمجيات/ الخوارزميات» Hadoop) Jès‏ 
(ls (NoSQLs MapReduce ga‏ 65 تطويرها للتغلّب على تحديات البيانات الضخمة. 

ومن الصعب التنبؤ ما سوف يحدث خلال العقد القادم في مجال التحليلات» وما امصطلحات 
الجديدة التي ستظهر؛ لقد ual‏ الزمنٌ الفجوة بين نماذج أنظمة المعلومات والتحليلات» وسيستمر 
في المستقبل القريب رغم أنَّ التحليلات ليست جديدةٌ؛ ولكن شعبيتها تزايدت بشكلٍ ملحوظ مؤخرًا 
وبفضل التزايد الهائل في البيانات الضخمة؛ أصبحت طرق جمع وتخزين هذه البيانات: وأدوات 
البرمجيات البديهيةء والرؤى التي تعتمد على البيانات أكثر سهولةً لرجال الأعمال من أيَّ وقتِ مضى. 
لذلك» وف خضم ال منافسة العا ميةء أصبحت الفرصة كبيرةً لاتخاذ قرارات إدارية أفضل باستخدام البيانات 
والتحليلات لزيادة الإيرادات مع خفض التكاليف من خلال إخراج منتجات أفضلء وتحسين تجربة 
العملاء واكتشاف الاحتيال قبل حدوثه. وتحسين تفاعل العملاء من خلال الاستهداف والإنتاج حسب 
طلب العميل مع قوة التحليلات والبيانات. ويتزايد عددُ الشركات التي تقوم حالياً بتدريب موظفيها 
على أدوات تحليل الأعمال؛ من أجل تحقيق أكثر فعالية وكفاءة في عمليات صنع القرارات اليومية. 

ويرگز القسم التالي على إطار عمل ذكاء الأعمال. وعلى الرغم من أن معظم الناس يتفقون على أن 
ذكاء الأعمال قد تطور إلى تحليلات وعلم البيانات؛ فإن العديد من ا مورّدين والباحثين لا يزالون يستخدمون 
هذا المصطلح. لذلك يولي القسم ٤-١‏ اهتمامًا بهذا التاريخ من خلال التركيز على ما يُسمَّى ذكاء الأعمال. 
وبعد القسم التالي» نقدّم التحليلات وسوف نستخدم ذلك كعلامة لتصنيف جميع المفاهيم ذات الصلة. 


أسئلة مراجعة على القسم لك 
-١‏ اذكر ثلاثة من المصطلحات التي سبقت التحليلات. 


7- ما الفرق الأساسي بين النْظُّم التي تُسمّى نظم المعلومات الإدارية ونظام دعم القرار ونظم 
امعلومات التنفيذية؟ 


- هل تطوّر نظام دعم القرار إلى ذكاء أعمال أو العكس؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £o‏ 


الفصل الأول 


٤-١‏ إطار عمل ذكاء الأعمال: 

لقد تمّ تنفيدٌ مفاهيم دعم القرار الواردة في القسمين ١-١‏ و١-١‏ بشكلٍ تدريجي» تحت أسماء 
مختلفة من قبل العديد من اممورّدين الذين قاموا بإنشاء أدوات وأساليب لدعم القرار. وكما 
لُوحِظ في القسم ٠-١‏ ومع نمو النظم على نطاق المؤسسة؛ تمكّن المديرون من الوصول إلى تقارير 
سهلة الاستخدام تمكّنهم من اتخاذ القرارات بسرعة. وبدأت هذه الأنظمةء التي كانت تُسمّى 
عمومًا نظم المعلومات التنفيذية 15158 تقدم تصورًا إضافيّاء وتنبيهات: وقدرات لقياس الأداء. 
وبحلول عام 7١٠٠م؛‏ ظهرت المنتجات والخدمات التجارية الرئيسة تحت مصطلح ذكاء الأعمال. 


تعريفات ذكاء الأعمال: 

ذكاء الأعمال (81) هو مصطلحٌ شامل يجمع بين البنيات والأدوات وقواعد البيانات والأدوات 
التحليلية والتطبيقات والمنهجيات. ويتزايد عددُ الشركات التي تقوم حالياً بتدريب موظفيها على 
أدوات تحليل الأعمال؛ من أجل تحقيق أكثر فعالية وكفاءة في عمليات صُنع القرارات اليومية وهناك 
نوع من الارتباك حول ذكاء الأعمال ناتج من موجة الاختصارات والكلمات الطنانة المرتبطة به (على 
سبيل المثال: إدارة أداء الأعمال [8221]). فالهدف الرئيس لذكاء الأعمال؛ هو تمكين الوصول التفاعلي 
وفي بعض الأحيان بشكل فوري إلى البيانات» لتمكين معالجة البيانات» وإعطاء مديري الأعمال والمحلّلين 
القدرة على إجراء التحليلات المناسبة. ومن خلال تحليل البيانات التاريخية والحاليةء والمواقف. 
والعروض» يستطيع ela‏ القرار الحصول على رؤى قَيّمة تمكنهم من اتخاذ قرارات أفضل وأكثر استنارة. 
وتستند عملية ذكاء الأعمال إلى تحويل البيانات إلى معلومات» ثم إلى قرارات» وأخيرا إلى إجراءات. 


لمحة تاريخية عن ذكاء الأعمال: 

لقد صيعٌ مصطلحٌ ذكاء الأعمال من قبل مجموعة 6811561 في منتصف التسعينيات ومع ذلك» 
وكما يشيرُ التاريخ في القسم السابق؛ فإنَّ هذا المفهوم أقدم من ذلك بكثيرء وله جذوره في نظم تقارير 
5 ف السبعينيات. وخلال تلك الفترة؛ كانت نظم التقارير ثابتة وكانت ثنائية الأبعاد. bs‏ تكن لديها 
قدرات تحليلية. وفي أوائل الثمانينيات؛ ظهر مفهوم نظم المعلومات التنفيذية 8158: وقد وسع هذا 
المفهوم الدعم المحوسب لدى كبار المديرين والمديرين التنفيذيين. ومن بين الإمكانات التي قدّمتها 
التقارير الديناميكية المتعددة الأبعاد (المخصصة أو حسب الطلب) التنبؤ وتحليل الاتجاهات» وتحليل 
التفاصيل» والوصول إلى الحالةء وعوامل النجاح الحرجة. وقد ظهرت هذه الميزات في العشرات من 


£1 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


امنتجات التجارية حتى منتصف التسعينيات» ثم ظهرت نفس القدرات وبعض الإمكانات الجديدة 
تحت اسم ذكاء الأعمال. واليوم؛ يحتوي ذكاء الأعمال الجيد القائم على أساس نظام المعلومات 
المؤسسية على جميع المعلومات التي يحتاجها المسؤولون التنفيذيون في مجال المعلومات. لذلك. تم 
تحويل المفهوم الأصلي لنظام المعلومات التنفيذي 1:15 إلى ذكاء الأعمال. وبحلول عام 0« بدأت 
أنظمة ذكاء الأعمال لتشمل قدرات الذكاء الاصطناعي بجانب قدرات تحليلية قوية. ويُوضُح الشكل 
9-١‏ مختلف الأدوات والأساليب التي يمكن إدراجها في نظام ذكاء الأعمالء ويوضح كذلك تطور ذكاء 
الأعمالء وتبين الأدوات المعروضة في الشكل قدرات ذكاء الأعمال وتتوفر هذه القدرات في منتجات 
ذكاء الأعمال الأكثر تطورًا. وبعضها الآخر متخصص في بعض منها فقط. 








Ic E 











[meu]. i zx 


اول بيانا 85 

mum — Hem E 
zi a 
Bm buc 








حت OLAP‏ 
— 
مركز القيادة الرقمية 
aso M‏ — .ولوحات البيانات 
© الأعمال عسل _ ل- aaa ٠‏ 
ولوحات المعلومات 

















EE [orn Eî swa ] 


شكل :4-١‏ تطور ذكاء الأعمال (81) 

















بنية ذكاء الأعمال: 
تتكوّن بنية نظام ذكاء الأعمال من أربعة مكؤنات رئيسة هي: 

-١‏ مستودعات البيانات مع بيانات مصدرها. 

-١‏ تحليلات الأعمالء وهي مجموعة أدوات معالجة وتنقيب وتحليل البيانات الموجودة 
في مستودعات البيانات. 

elis -Y‏ إدارة الأعمال لمراقبة وتحليل الأداء. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ev‏ 





























الفصل الأول 


ع- واجهة مستخدم (على سبيل المثال: لوحة المعلومات). 
ويوضح الشكل ٠١-١‏ العلاقة بين هذه المكونات. 


الآداء والإستراتيجية . بينة تحليلات الأعمال بيئة مستودع البيانات 





3m 1 واجهة المستخدم‎ 
المتصفح :المكونات المستقبلية‎ 3 
أنظمة ذكية‎ EE البوابة‎ 
حة المطومات‎ 
source: based on w.eckerson smart companies in the 21st century the secrets of creating. successful 


business intelligent sollutions. the data warehousing inistilute.seattle . wa.2003..p.32.iiiuslration 5 


شكل :٠١-١‏ بنية عالية المستوى لذكاء الأعمال 


أصول ومحركات ذكاء الأعمال: 

من أين أتت الطرق الحديثة لمستودع البيانات وذكاء الأعمال؟ وما هي جذورها؟ وكيف تؤثر 
تلك الجذور على الطريقة التي تدير بها المنظمات هذه المبادرات اليوم؟ إن الاستثمارات الحالية في 
تقنية المعلومات تخضع لزيدٍ من التدقيق من حيث تأثيرها على خط الأساس واحتماليتها. وينطبق 
الشيء نفسه على مستودعات البيانات وتطبيقات ذكاء الأعمال التي تجعل هذه المبادرات ممكنة. 

وتضطر المنظمات إلى استيعاب بياناتها وفهمها وتسخيرها لدعم القرارات لتحسين العمليات 
التجارية. فالقوانين والتنظيمات (مثل: قانون ساربينز - أوكسلي لعام ؟١٠7)‏ تتطلب الآن من سير 
الأعمال توثيق عملياتهم التجارية والتوقيع على قانونية المعلومات التي يعتمدون عليها وتقديم 
تقرير إلى حاملي الأسهم. وعلاوةً على ذلك؛ أصبحت أوقات دورة الأعمال مضغوطةً للغاية وأسرع 
وأكثر استنارةً وأصبحت هناك حاجة لاتخاذ قرار أفضل: وبالتالي» زاد احتياجُ المديرين إلى المعلومات 
الصحيحة في الوقت المناسب وفي المكان المناسب. وهذا هو شعار النهج الحديث لذكاء الأعمال. 

ويجب على المنظمات أن تعمل بذكاء مع الاهتمام البالغ بإدارة مبادرات ذكاء الأعمال 
i c‏ جانبًا ضروريًا من جوانب الأعمال. وليس مثيرا للدهشة أن تناصر المنظمات بشكلٍ 
متزايد ذكاء الأعمال في تجسيدها الجديد كتحليلات. وتعرض حالة عملية ١-١‏ أحد تطبيقات 


^£ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


ذكاء الأعمال الذي ساعد العديد من شركات الطيران» وكذلك بالطبعء الشركات التي تقدم هذه 
الخدمات لشركات الطيران. 
حالة عملية ١-١‏ 
شركة 53516 تساعد عملاءها من خلال لوحات ال معلومات والتحليلات 

تُعَدُ 6د5 واحدةً من الشركات العالمية الرائدة في صناعة الرحلات السياحية. 
وتقوم الشركة بتوفير الخدمات للأشخاص والشركات. وهي تخدمٌ المسافرين 
ووكلاء السفر والشركات ومورّدي خدمة السفر من خلال أربع شركات رئيسة 
«Sabre Airline Solutions «Sabre Travel Networks Travelocity :„—»‏ 
JS ias .Sabre Hospitality Solutions s‏ البيئة الاقتصادية العاطية المتقلبة الحالية 
تحديات تنافسية كبيرة لصناعة الطيران. aiU‏ فُدمًا في ا منافسة» اعترفت شركة 
oL Sabre Airline Solutions‏ المديرين التنفيذيين في شركات الطيران يحتاجون إلى 
أدوات مُحسّنة لإدارة قراراتهم التجارية والتخلّص من الإجراءات التقليدية واليدوية التي 
تستغرق وقنًا طويلًا لجمع المعلومات المالية وغيرها من المعلومات اللازمة للمبادرات 
القابلة للتطبيق. وهذا يتيح دعم القرار في الوقت المناسب لشركات الطيران في جميع 
أنحاء العام لتحقيق أقصى قدرٍ من العائدات على المعلومات من خلال أفكار قيادية 
وذكاء قابل للتطبيق: وقيمة للعملاء من البيانات المتنامية. 

قامت شركة 58056 بتطوير مستودع بيانات سفريات المؤسسة (ETDW)‏ 
باستخدام تيراداتا للاحتفاظ ببيانات الحجوزات الهائلة. ويتم تحديث مستودع بيانات 
سفريات المؤسسة بشكل فوري تقريبًا بدفعات تعمل كل ٠١‏ دقيقةء ولجمع البيانات 
من جميع الأعمال التابعة لشركة .Sabre‏ وتستخدم 58076 مستودع بيانات سفريات 
المؤسسة لإنشاء لوحات المعلومات التنفيذية التي توفر رؤى تنفيذية لحظية باستخدام 
Cognos à az‏ ذكاء الأعمال -Oracle Goldengat s Oracle Data Integrator ge‏ 
وتوفر لوحات المعلومات التنفيذية للمديرين وصُّناع القرار رفيعي ا مستوى من شركات 
الطيران والعملاء حلا آليَّا سهل الاستخدام يجمع بين مقاييس الأداء الحساسة بطريقة 
موجزة وتقديم نظرة ثاقبة سريعة بدرجة 7١‏ عن صحة شركة الطيران. وفي إحدى 
شركات الطيران: توفر لوحات المعلومات التنفيذية لشركة 53556 للإدارة العليا صورةً 
يوميةً ولحظية لمؤشرات الأداء الرئيسة في تطبيق واحد تحل محل العملية التي يتم 
إجراؤها $ra‏ واحدة في الأسبوع والتي تستغرق ۸ ساعات لتوليد التقرير نفسه من 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري لق 


الفصل الأول 


مصادر البيانات المختلفة. إن استخدام اللوحات لا يقتصر على العملاء الخارجيين 
بل تستخدمها Sabre‏ أيضاً لتقييمها للأداء التشغيلي الداخلي. 

وتساعد لوحات المعلومات عملاء de Sabre‏ الفهم الواضح للبيانات من خلال 
شاشات العرض المرئية التي تتضمّن قدراتٍ تفاعلية» يستبدل العروض التقدهية امسطحة 
ويسمح براجعة أكثر تركيرًا للبيانات بأقل جهد ووقت. هذا يُسهُّل حوار الفريق من 
خلال إتاحة البيانات/ المقاييس المتعلقة بأداء المبيعات للعديد من المستفيدين: بما في 
ذلك التذاكرء والمقاعد المباعة والطيران: والأداء التشغيلي بما في ذلك البيانات المتعلقة 
بحركة الطيران «giallo‏ وحجوزات العملاء والمخازنء والإيرادات عبر توزيع شركة طيران 
متعددة القنوات. وتوفر أنظمة لوحة المعلومات البنية التحتية القابلة للتوسع: ودعم 
واجهة المستخدم الرسومية» وتكامل البيانات. والتجميع الذي ممكن المديرين التنفيذيين 
في شركات الطيران من أن يكونوا أكثر إيجابيةً في اتخاذ إجراءات تؤدي إلى آثار إيجابية 
على الصحة العامة لشركات الطيران التابعة لهم. 

وباستخدام 8110117 الخاص بهاء تستطيع 53016 كذلك تطوير حلول تحليلية 
وإعداد تقارير أخرى تستندٌ إلى الويب» والتي تتيح الحصول على البيانات من أجل 
الحصول على رؤى العملاء من خلال تحليل الملفات الشخصية للعملاء وتفاعلات 
مبيعاتهم من أجل حساب قيمة العملاء. وهذا يتيح تقسيماً أفضل للعملاء وإحصاءات 
للخدمات ذات القيمة المضافة. 

أسئلة للمناقشة: 

-١‏ ما هي التقارير التقليدية؟ وكيف يتم استخدامها في المنظمة؟ 

۲- كيف يمكن استخدام التحليلات لتحويل التقارير التقليدية؟ 

-٠‏ كيف Sg‏ للتقارير التفاعلية أن تساعد الشركات في صُنْع القرار؟ 

ما الذي الذي يمكننا أن نتعلمه من هذه الحالة العملية؟ 

تُوضّح هذه الحالة العملية أن المنظمات التي استخدمت تقاريرها في وقتِ سابق فقط 
لتتبع أعمالها الداخلية وتلبية متطلبات التوافق التي وضعتها الحكومة تتجه الآن نحو 
توليد معلومات ذكية قابلة للتطبيق من بيانات معاملاتها التجارية. وقد أصبحت التقاريرٌ 
أكثر اتساعًا؛ إذ تحاول المنظمات الآن تحليل بيانات المعاملات المؤرشفة؛ لفهم التوجهات 
والأنماط الخفية الكامنة التي تمكّنها من اتخاذ قرارات أفضل من خلال اكتساب رؤى حول 


o.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


المجالات التي تنطوي على مشكلات وحلها لمتابعة فرص السوق الحالية والمستقبلية. وقد 
تطورت التقارير إلى تقارير تفاعلية عبر الإنترنت» وهو ما يِمكّن المستخدمين من الحصول 
على بيانات سريعة وإنشائهاء مساعدة أدوات التصوير التي لديها القدرة على الاتصال 
بقاعدة البيانات؛ مما يوفر إمكانيات التعمق في البيانات الملخّصة. 
Source: Teradata.com, "Sabre Airline Solutions; Terry, D. (2011), "Sabre Streamlines‏ 
Decision Making? — http://www.Teradatamagazine.com/v1 1n04/Features/Sabre-‏ 
Streamlines-Decision-Making/(Accessed July 2016).‏ 
استعمال الوسائط المتعددة في ذكاء الأعمال: 
تتضمَّن شبكة جامعة تيراداتا 11013 مقاطع الفيديو (على غرار البرنامج التلفزيوني (CSI‏ لتوضيح 
مفاهيم التحليلات في مختلف الصناعات. ويُطلّق عليها اسم «مقاطع فيديو تقمّي سيناريوهات 
الأعمال 851». وهى ليست لمجرد التسلية؛ ولكنها تزؤد الفصل الدراسى ببعض الأسئلة للمناقشة. 
وبالنسبة i Saal‏ يرجَى الانتقال إلى: http://wwwteradatauniversitynetwork.com/‏ 
Library/Items/BSI- The-Case-of-the-Misconnecting-Passengers‏ أو www.youtube.com/‏ 
watch? v=NXEL5F4_aKA‏ ومشاهدة الفيديو الذي يظهر على يوتيوب. وعليك أن تفترض قيامك 
بدور مركز خدمة العملاء المهنية. وقد بدأت الرحلة القادمة في وقتِ متأخرء ومن ed AA‏ أن يفقد 
العديد من الركاب رحلاتهم. وهناك مقاعدٌُ في رحلة مغادرة واحدة يمكن أن تستوعب اثنين من الركاب 
الأربعة. فأي من الركاب يجب أن تُعطَى إليه الأولوية؟ ويتم إعطاؤك معلومات حول ملامح العملاء 
والعلاقات بشركة الطيران. وهنا قد تتغيرٌ قراراتك عندما تتعلم المزيد عن ملفات التعريف لهؤلاء العملاء. 
شاهد الفيديو وأوقفه كلما لزم الأمرء وأجب عن الأسئلة التي ينبغي أن يُعطَّى فيها الأولوية 
للمستفيدين. ثم استأنف مشاهدة الفيديو؛ للحصول على مزيدٍ من المعلومات. وبعد اكتمال الفيديو 
يمكنك مشاهدة الشرائح المتعلقة بهذا الفيديو وكيف E5‏ إعداد التحليل على شريحة مُحدّدة في: 
www.slideshare.net/teradata/bsi-how-we-did-it-the-case-of-the-misconnecting-passengers.‏ 
وتوفّر هذه الرحلة المتعددة الوسائط مثالاً على كيفية مساعدة المعلومات الإضافية المتاحة 
من خلال مشروع مستودع البيانات DW‏ $ صُنع القرار. 
على الرغم من أن البعض يساوي بين نظام دعم القرار وذكاء الأعمال؛ فإنَّ هذه الأنظمة 
ليست في الوقت الحاضر متساويةً. المثير للاهتمام أن نلاحظ أن بعض الناس يعتقدون أن نظام 
دعم القرار 255 هو جِزْءٌ من ذكاء الأعمال وإحدى أدواتها التحليلية. ويعتقد آخرون أنَّ ذكاء 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري o‏ 


الفصل الأول 


الأعمال هو حالة خاصة من أنظمة دعم القرار التي تتناول في الغالب إعداد التقارير والتواصل 
والتعاون (شكل من أشكال أنظمة دعم القرار ا موجهة بالبيانات). وة تفسير آخر قال به 
)Ws01 2005(‏ هو أن ذكاء الأعمال ما هو إلا نتيجة لتطؤر مستمرء وعلى هذا النحو؛ فإن 
نظام دعم القرار هو أحد عناصر ذكاء الأعمال الأصلية. وعلاوةً على ذلكء وكما هو مُبيّن في 
القسم التالي وما بعده؛ نجد أنه وفي العديد من الدوائر. تم دمج ذكاء الأعمال من خلال تحليلات 
مصطلحات جديدة أو علم البيانات. 
معالجة العمليات مقابل المعالجة التحليلية: 

لتوضيح الخصائص الرئيسة لذكاء الأعمال؛ سنقوم أولا ببيان أن ذكاء الأعمال لا 353 معالجة 
للمعاملات. إننا جميعًا على دراية بأنظمة المعلومات التي تدعم معاملاتناء مثل أجهزة الصراف 
JYI‏ والودائع المصرفيةء وفحص النقود في متجر البقالةء وما شابهها. وتشارك أنظمة معالجة 
العمليات هذه باستمرار في التعامل مع التحديثات فيما يمكن أن نسميه قواعد البيانات 
التشغيلية. فعلى سبيل المثال: في عملية السحب من أجهزة الصراف الآليء نكون بحاجة إلى 
تقليل رصيدنا المصرفي وفقاً لذلك؛ في حين أنَّ الإيداع البنكي يضيف إلى الحساب. ومن المرجّح أن 
تظهر مشتريات متجر البقالة في حساب ال متجر من خلال إجمالي المبيعات لهذا اليوم وينبغي أن 
تعكس تخفيضاً مناسباً في المخزون من الأصناف التي اشتريناها وهكذا. وتعالج أنظمة معالجة 
العمليات الفورية هذه (01:12©) نشاط الشركة المعتاد والمستمر. وعلى النقيض من ذلك؛ فإن 
مستودع البيانات يكون عادةً نظامًا متميرًا يوفر التخزين للبيانات التي سيتم استخدامها للتحليل. 
والقصد من هذا التحليل؛ هو إعطاء الإدارة القدرة على تنظيف البيانات للحصول على معلومات 
عن الأعمال» وهكن استخدامها لتوفير الدعم التكتيكي أو التنفيذي للقرار؛ إذ يكن للمديرين 
المباشرين» على سبيل المثال» اتخاذ قرارات أسرع و/أو أكثر استنارة. وسوف نقدّم تعريقًا أكثر 
cun‏ لمستودع البيانات في الفصل الثانيء ولكن يكفي أن نقول بأن مستودعات البيانات تهدف 
إلى العمل مع البيانات المعلوماتية ال مُستخدّمة في نظم المعالجة التحليلية الفورية OLAP)‏ 
ويتم تخزين معظم البيانات التشغيلية في نظم تخطيط موارد المؤسسة (8185) وفي أشقائها 
التكميليين» مثل إدارة سلسلة التوريد (5021) أو نظام إدارة العملاء à dA (CRM)‏ نظام 
معالجة العمليات الفورية 01:18» وهو نوعٌ من معالجة الحاسوب حيث يستجيب الحاسوب 
فورًا لطلبات المستخدمين. JS iaio‏ طلب معاملة وهو سجلٌ محوسب لحدث منفصل» مثل 
استلام المخزون أوامر العميل. وبعبارة أخرى؛ تطلب المعاملة مجموعةً من اثنين أو أكثر من 
تحديثات قاعدة البيانات التي يجب أن تكتمل بطريقة كلّ شيء أو لا شيء. 


or‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


إن التصميم الذي يجعل نظام 01:18 هذا فعَالًا لمعالجة العمليات يجعله غير فعال بالنسبة 
للتقارير والاستعلامات والتحليلات الخاصة بالمستخدم النهاي. وفي الثمانينيات» أشار العديدٌ من 
المستخدمين من رجال الأعمال إلى إطاراتهم الرئيسة على نها «ثقوب سوداء» لأن كلّ ا معلومات 
دخلت إليهاء ولكن لم يرجع أي منهم على الإطلاق. ويجب أن يبرمج موظفو تقنية المعلومات 
جميع طلبات تقديم التقاريرء في حين أنه هكن إصدار التقارير «المسبقة أو الأكثر استخداما» 
وحدها على أساس مجدولء إن الاستعلام الفوري المخصص مستحيل تقريبًا. وعلى الرغم من أن 
نظم تخطيط موارد المؤسسات القائمة على العميل/ الخادم في التسعينيات كانت أكثر ملاءمة 
لإعداد التقارير؛ فإنها ما زالت بعيدة كل البعد عن الاستخدام المرغوب فيه من قبل المستخدمين 
النهائيين وغير التقنيين لأمور مثل إعداد التقارير التشغيلية والتحليل التفاعلي وما إلى ذلك. ولحلٌ 
هذه القضايا؛ تمّ إنشاء مفاهيم مستودع البيانات وذكاء الأعمال. 

وتحتوي مستودعات البيانات على مجموعة واسعة من البيانات التي تقدّم صورةً متماسكة 
لأوضاع الأعمال في وقتٍ واحد. وكانت الفكرة هي إنشاء بنية تحتية لقاعدة البيانات التي كانت دايا 
على شبكة الإنترنت وتتضمّن جميع ال معلومات من أنظمة 011۶ء ها في ذلك البيانات التاريخية 
ولكن أعيد ترتيبها وتنظيمها بطريقة سريعة وفعّالة للاستفسار والتحليل ودعم القرار. إِنَّ فصل 
عن التحليل ودعم القرار تمكّن من الاستفادة من ذكاء الأعمال وهو ما وصفناه في وقتِ سابق. 
التخطيط المناسب والتوافق مع إستراتيجية الأعمال: 

أولاً وقبل كلّ شيء. يجب أن تكون الأسباب الأساسية للاستثمار في ذكاء الأعمال متوافقةً مع 
إستراتيجية أعمال الشركة. إِنَّ ذكاء الأعمال ليس مجرد ممارسة تقنية لقسم نظم المعلومات؛ بل 
يجب أن يكون وسيلةً لتغيير الطريقة التي تقوم بها الشركة التجارية من خلال تحسين عملياتها 
التجارية وتحويل عمليات صُنع القرار؛ لتكون قائمةً إلى حَذَّ كبير على البيانات. ويشير العديدٌ من 
استشاريي وممارسي ذكاء الأعمال الذين يشاركون في مبادرات ذكاء الأعمال الناجحة إلى أن إطار 
التخطيط هو شرطٌ مسبقٌ ضروري. يقوم أحد إطارات العمل الذي تم تطويره بواسطة مجموعة 
جارتتر (2004) 20261 بتحليل وتخطيط وتنفيذ مكونات الأعمال والمنظمة والوظائف والبنية 
التحتية. وعلى مستوى الأعمال وا مستويات التنظيمية؛ يجب تحديدٌ الأهداف الإستراتيجية 
والتشغيلية مع مراعاة ال مهارات التنظيمية المتاحة لتحقيق تلك الأهداف. ويجب على الإدارة 
العليا أن تنظر في قضايا الثقافة التنظيمية التي تحيط بمبادرات ذكاء الأعمال وحفز تلك المبادرات 
والإجراءات المتعلقة بمشاركة أفضل ممارسات ذكاء الأعمال المتبعة في الإدارة العليا داخل الشركة 
مع وَضْع الخطط اللازمة لإعداد المنظمة من أجل التغيير. ومن بين الخطوات الأولى في هذه 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري or‏ 


الفصل الأول 


العملية تقييم تنظيم نظام المعلومات ومجموعات مهارات الفئات المحتملة من الطمستخدمينء 
وما إذا كانت الثقافة قابلةَ للتغيير. ومن خلال هذا التقييم» وعلى افتراض وجود مبرر/ ضرورة 
للمُضي قُدُمَه يممكن للشركة إعداد خطة عمل مفصلة. وَثمّة مسألة حاسمة أخرى لنجاح تنفيذ 
نظم ال معلومات وهي دمج العديد من مشاريع ذكاء الأعمال (حيث تستخدم معظم المؤسسات 
العديد من مشاريع ذكاء الأعمال) فيما بينها من جانب ومع أنظمة تقنية المعلومات الأخرى في 
المنظمة وشركائها التجاريين من جانبٍ آخر. 
من الحكمة البدءٌ في استخدام ذكاء الأعمال وإنشاء مركز كفاءة ذكاء الأعمال إذا كانت إستراتيجية 
الشركة تتماثى بشكلٍ صحيح مع أسباب مبادرات مستودعات البيانات وذكاء الأعمال. وإذا كان نظام 
المعلومات قادرًا أو بإمكانه القيام بدوره في مثل هذا المشروع؛ وإذا كان مجتمع المستخدمين المستهدّف 
موجوداً ولديه الدافعية؛ حينها بإمكان المركز أن يقدم الخدمات التالية (2004 متعصاممة»): 
- يمكن للمركز أن يُوضُح كيف يرتبط ذكاء الأعمال بالإستراتيجية وتنفيذ الإستراتيجية. 
- يمكن أن يعمل ا مرك على تشجيع التفاعل بين مجتمعات مستخدمي الأعمال المحتملين وتنظيم نظم المعلومات. 
- هكن للمركز أن يعمل كمستودع ومُورّع لأفضل ممارسات ذكاء الأعمال بين مختلف خطوط الأعمال. 
- يمكن للمركز تأسيسٌ معايير للتميّز في ممارسات ذكاء الأعمال وتشجيعها من خلال الشركة. 
- يمكن أن تتعلّم منظمات نظم المعلومات الكثير من خلال التفاعل مع مجتمعات المستخدمين, 
مثل المعرفة حول مجموعة متنوعة من الأدوات التحليلية المطلوبة. 
- يمكّن مستخدمي الأعمال التجارية ومنظمات نظم المعلومات من فهم أفضل للسبب الذي يستوجب 
أن تكون منصة مستودع البيانات مرنةً مما فيه الكفاية لتوفير متطلبات العمل المتغيرة. 
- يمكن أن تساعد حاملي الأسهم المهمين» مثل المديرين التنفيذيين رفيعي المستوى؛ على فهم كيف 
يمكن أن يلعب ذكاءٌ الأعمال دورًا مهمًاء 
ومن عناصر ذكاء الأعمال الأخرى الناجحة قدرته على توفير بيئة فاعلة سنعرضها فيما يلي: 
ذكاء الأعمال الفوري وعند الطلب أصبح متاحاً: 
لقد تزايدت الحاجةٌ إلى الوصول الفوري إلى المعلومات المشتتة بناءً على الطلب من أجل 
سد الفجوة بين البيانات التشغيلية والأهداف الإستراتيجية؛ وهو الأمر الذي أصبح أكثر إلحاحًا. 
ونتيجةً لذلك؛ ظهرت id‏ من المنتجات تُسمّى تطبيقات ذكاء الأعمال الفورية. ومن شأن إدخال 
تقنيات جديدة لتوليد البيانات» مثل تقنية ۸۴1۲ وغيرها من أجهزة الاستشعارء أن يؤدي إلى 


ot‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


تسريع هذا النموٌ وتلبية الحاجة إلى ذكاء الأعمال بشكلٍ فوري. وتستخدم أنظمة ذكاء الأعمال 
التقليدية قدرًا كبيرَا من البيانات الثابتة التي تمّ استخراجها وتنقيتها وتنزيلها إلى مستودع 
البيانات لإنتاج التقارير والتحليلات. ومع ذلك؛ فإن الحاجة ليست مجرد إعداد التقرير؛ لأن 
ا مستخدمين يحتاجون إلى مراقبة «Jis‏ وتحليل الأداءء وفهم لماذا تحدث الأمور. وهذا يمكن أن 
يساعد المستخدمينء الذين يحتاجون أن يعرفوا (تقريبًا بشكل فوري) معلومات عن التغييرات في 
البيانات أو توفُر التقارير ذات الصلة والتنبيهات» والإخطار بشأن الأحداث والاتجاهات الناشئة 
في تطبيقات وسائل التواصل الاجتماعي. وبالإضافة إلى ذلك؛ هكن برمجة تطبيقات الأعمال 
للعمل على ما تكتشفه أنظمة ذكاء الأعمال هذه في الوقت ال مناسب. على سبيل المثال: قد يقوم 
(502) بتقديم طلب تلقاق؛ للحصول على المزيد من «الأدوات» عندما يكون المخزون dl‏ 
A i‏ معين أ وجينها يق نظام dle cibis ases ea t ons lll aae‏ 
الائتمان للتحقق من عملية عبر الإنترنت قيمتها تجاوزت ٠٠٠٠١‏ دولار. 

من الطرق التي يستخدمها ذكاء الأعمال لتوفير البيانات في الوقت المناسب نموذج مستودع 
البيانات الذي تستخدمه أنظمة ذكاء الأعمال التقليدية. وفي هذه الحالة؛ توفْر المنتجات التي 
يقدّمها مورّدو منصة ذكاء الأعمال المبتكرة حلا موجهًا بالخدمة وبشكل فوري تقريبّاء والذي 
يقوم بتعبئة مستودع البيانات (1117) بشكل أسرع مما يقوم به التحديث الدوري التقليدي من 
استخراج/ نقل/ تنزيل (انظر الفصل "). الطريقة الثانية تُسمّى بإدارة نشاط الأعمال (84131) 
فيتمٌ استخدامه من قبل مورّدي 84231 و/أو مورّدي وسطاء sl Savvion x24) L&s BAM‏ 
برنامج .(Vineyard 3| Tibco si Quantive 5i webMethods 5| Vitria gÎ Iteration‏ 5259 
يتجاوز مستودع البيانات تمامًا ويستخدم خدمات الويب أو غيرها من وسائل الرّصد لاكتشاف 
الأحداث التجارية الرئيسة. ويمكن وَضْع أجهزة مراقبة البرنامج (أو وكلاء الذكاء) على خادم 
منفصل في الشبكة أو في قواعد بيانات تطبيقات العمليات نفسهاء ويمكنهم استخدام الأساليب 
القائمة على العمليات؛ من أجل قياس العمليات التشغيلية بشكل استباقي وبذكاء. 
تطوير أو حيازة أنظمة ذكاء الأعمال: 

يقدّم اليوم العديدٌ من المورّدين أدواتٍ متنوعة البعض منها مبرمجٌ بشكل كاملٍ ويُطلّق 
«Shells lale‏ وكل ما يجبُ على المستخدم فعله هو إدخال الأرقام الخاصة به؛ ويمكن شراء هذه 
الأدوات أو تأجيرها. وللحصول على قائمة بالمنتجات والعروض التوضيحية والمزيد من المعلومات 
عن المنتجات الحالية: انظر أدلة المنتج على موقع معهد مستودعات البيانات 60501.018. وما 
عليك إلا أن تقوم بتسجيل المستخدم مجانًا. ويتم إنشاء جميع تطبيقات ذكاء الأعمال تقريبًا مع 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري o0‏ 


الفصل الأول 


lg shells‏ يوفرها المورّدون أنفسهم الذين يقومون بإنشاء حل مخصص للعميل أو العمل مع 
مورّد آخر يستعين بمصادر خارجية. إِنَّ المشكلة التي تواجهها الشركات هي اختيار البديل: الشراء 
أو الإيُجنا أو الإنفناء. ولكلٌ من هده البداقل عدة ختارات:ومننبين اللعابير الركيسة لاتخاذ 
القرار؛ هو التحليل وتحليل التكلفة وا منافع. 
الضبط وتحليل التكاليف والمنافع: 

مع زيادة عدد تطبيقات ذكاء الأعمال المحتملة؛ تنشأ الحاجة إلى ضبطها وتحديد أولوياتها. 
وهذه ليست مهمة سهلة بسبب العدد الكبير من الفوائد غير المباشرة؛ إذ يجبٌ تحديد الفوائد 
المباشرة وغير المباشرة. وبطبيعة الحال؛ فإنَّ ذلك يحدث عندما تكون معرفة تطبيقات مختلفة 
في ا منظمات الأخرى ودراسات الحالة مفيدة للغاية. على سبيل المثال: يوفر معهد مستودعات 
البيانات (0591.018]) ثروة من المعلومات عن المنتجات والتطبيقات والتطبيقات المبتكرة. ويمكن 
أن تكون هذه المعلومات مفيدةً في تقدير الفوائد المباشرة وغير المباشرة. 
أمن وحماية الخصوصية: 

هذه مسألةٌ مهمةٌ للغاية في تطوير أيّ نظام محوسب, وخاصةً ذكاء الأعمال الذي يحتوي على 
البيانات التي قد يكون لها قيمة إستراتيجية. وكذلك يجبٌ حماية خصوصية الموظفين والعملاء. 
تكامل الأنظمة والتطبيقات: 

باستثناء بعض التطبيقات الصغيرة؛ يجب تكامل جميع تطبيقات ذكاء الأعمال مع أنظمة 
أخرى؛ مثل: قواعد البيانات» والأنظمة القدهةء ونظم المؤسسة (خاصةً 812 و0831) والتجارة 
الإلكترونية (البيع والشراء)؛ بل وأكثر من ذلك. وبالإضافة إلى ذلك؛ فإن تطبيقات ذكاء الأعمال 
ترتبط عادةً بالإنترنت وفي أحيان كثيرة بنظم معلومات شركاء الأعمال. 

وعلاوةً على ذلك؛ تحتاج أدوات ذكاء الأعمال أحيانًا إلى التكامل والدعم فيما بينها. وقد 
دفعت الحاجة إلى التكامل مورّدي البرامج إلى إضافة قدراتهم باستمرار إلى منتجاتهم. إن العملاء 
الذين يشترون حزمة البرمجيات المتكاملة يتعاملون مع مورّد واحدٍ فقط ولا يحتاجون إلى التعامل 
مع أنظمة أخرى. ولكنهم قد يفقدون مَيْرَة إنشاء نظم abs‏ من مكوّنات «من سلالة أفضل». 
أسئلة مراجعة على القسم :6-١‏ 
-١‏ عرّف ذكاء الأعمال. 


o1‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


۲- اذكر مع الشرح المكونات الرئيسة لذكاء الأعمال. 
.OLTP .3je -Y‏ 
ع- عرّف 42.آ0. 
-٥‏ اذكر بعض مجالات التنفيذ التي تناولها تقرير -Gartner‏ 
"- اذكر بعض عوامل النجاح الأخرى لذكاء الأعمال. 
0-١‏ نظرة عامة على التحليلات: 
لقد حلت كلمة التحليلات إلى حَدٌ كبير محل ال مكؤّنات الفردية السابقة لتقنيات دعم القرار 
المحوسبة التي كانت متوفرةً تحت تسميات مختلفة في الماضي. وفي الواقع؛ فإن العديد من 
الممارسين والأكاديميين الآن يستخدمون كلمة التحليلات بدلا من ذكاء الأعمال. وعلى الرغم من أن 
العديد من المؤلفين والاستشاريين عرّفوها بشكلٍ مختلف قليلاً؛ فقد يُنظر إلى التحليلات على أنها 
عملية وَضْع قرارات قابلة للتطبيق أو توصيات لاتخاذ إجراءات بناءَ على رؤى متولدة من البيانات 
التاريخية. ووفقاً لمعهد بحوث العمليات وعلوم الإدارة (1818013/15)؛ فإِنَّ التحليلات تمثل مزيجاً 
من تقنيات الحاسوب» وتقنيات علم الإدارة والإحصاءات لحل مشكلات حقيقية. وبطبيعة الحال؛ 
فقد اقترحت منظمات أخرى كثيرة تفسيراتها ودوافعها للتحليلات. فعلى سبيل المثال: اقترح معهد 
5 ثشمانية مستويات من التحليلات تبدأ بتقارير موخّدة من النظم الحاسوبية وتوفر هذه التقارير 
وصفاً لما يحدث داخل المنظمة» وقد مكّنتنا التقنيات الإضافية من إنشاء تقارير مُخصّصة بتفاصيل 
أكثر. ويعود التطؤر التالي في إعداد التقارير إلى طلبات البحث من نوع ا معالجة التحليلية الفورية 
التي تسمح للمستخدم بالاستكشاف بشكلٍ أعمق وتحديد مصادر معينة للمشكلات أو الفرص. 
التقنيات المتاحة اليوم لديها القدرة على إصدار تنبيهات لصناع القرار حينما يسوء الأداء على 
سبيل المثالء وقد تكون هذه التنبيهات للمستهلك فيما يتعلق بالطقس أو قضايا أخرى. ولكن 
يمكن على غرار ذلك إنشاء التنبيهات في سياق إعدادات معينة عندما تكون المبيعات أعلى أو أقل 
من مستوى معين خلال فترة زمنية معينة أو عندما يكون المخزون للنتج معين منخفضاً. وكلّ 
هذه التطبيقات تكون ممكنةً من خلال تحليل البيانات التي يتم جمعها من قبل منظمة ماء وقد 
يستلزعٌ هذا التحليل تحليلاً إحصائياً لفهم الأنماط بشكل أفضل. ويمكن بعد ذلك اتخاذ خطوة 
أخرى لتطوير التنبؤات أو نماذج للتنبؤ بكيفية استجابة العملاء لحملة تسويقية معينة أو عروض 
خدمات/ منتجات مستمرة. وعندما تكون لدى المنظمة رؤية جيدة لما يحدث وما قد يحدث». 
يمكنها أيضاً أن تستخدم أساليب أخرى لإصدار أفضل القرارات في ظل الظروف القائمة. وتُصنّف 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ov‏ 


الفصل الأول 


على ثمانية مستويات للتحليلات ولمزيدٍ من التفاصيل بالإمكان النظر في العرض التوضيحي اللمقدَّم 
من معهد 545 على الرابط: (sas.com/news/sascom/analytics levels.pdf)‏ 

Cod i alls‏ هذه الفكرة ا متمثلة في دراسة البيانات بشكل كامل لفهم ما يحدث» وما 
سيحدثء وكيفية تحقيق أفضل استفادة منها في اقتراح ثلاثة igi sud‏ من التحليلات. وتم 
تحديدٌ هذه المستويات الثلاثة (المعلوماتية/ المجتمعية/ التحليلية) على أنها وصفية: وتنبؤية, 
وتوجيهية. يعرض الشكل ١١-١‏ عرضاً بيانياً لأنواع التحليل الثلاثة ويشير إلى أن هذه المستويات 
الثلاثة مستقلةٌ إلى حَدّ ماء وأن كلاً منها يؤدي إلى الآخر. كما يشير إلى وجود بعض التداخل عبر 
هذه الأنواع الثلاثة من التحليلات. وسواءً كانت مستقلةً أو متداخلةً؛ فإن الطبيعة المترابطة 
لمختلف أنواع التحليلات واضحةٌء وسيتم شرح المستويات الثلاثة في الأقسام التالية. 


ماذا ينبغى أن أفعل؟ ماذا سيحدث؟ ماذا حدث؟ 5 
لماذا ينبغى أن أفعله؟ لماذا سيحدث * A E.‏ 
الأمثلية ر التنقيب فى البيانات ر إعداد تقارير الأعمال ر 3 
MSN‏ 7 التنقيب فى النصوص ر لوحات المعلومات ر J‏ 
نمذجة القرار “ اتتقيب فى رساتل الإعلامالويب “ بطاقات النتانج ‏ 7 3 
النظم الخبيرة * التنبؤات t‏ مستودعات البيانات ” » 

أفضل قرارات وتصرفات توقعات مستقبلية دقيقة مشاکل وفرص 
الأعمال الممكنة للأحداث والنتائج عمل محددة جيدا i‏ 








الشكل :1١-١‏ أنواع التحليلات الثلاثة 


التحليلات الوصفية: 
تشيرٌ التحليلات الوصفية (أو التقارير) إلى معرفة ما يحدث في المنظمة وفهم بعض الاتجاهات 
والأسباب الكامنة وراء مثل هذه التجارب. ينطوي ذلك على توحيد مصادر البيانات وتوفر 


o^‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


جميع البيانات ذات الصلة في شكل يتيخ إعداد التقارير والتحليلات المناسبة: عادةً ما يكون 
تطوير هذه البنية الأساسية للبيانات حزءًا من مستودعات البيانات. ومن هذه البنية الأساسية 
للبيانات يمكننا تطويرٌ التقارير ا مناسبة» والاستعلامات» والتنبيهات» والاتجاهات باستخدام أدوات 
وأساليب إعداد التقارير المتنوعة. 

من التقنيات المهمة التي تشكّل لاعباً أساسيًا في مجال التحليلات الوصفية؛ التصويرٌ باستخدام 


أحدث أدوات التصوير في السوقه والتي تمكّننا من استخراج رؤى قوية من عمليات منظماتنا. 
(dssbibook.com)‏ 


حالة عملية ۲-١‏ 
شركة سيلفاريس (51170515) توسّع أعمالها باستخدام التحليل المرني» وإمكانيات إعداد التقارير الفورية 
تأسّست شركة 51188215 في عام ١٠٠٠م‏ من قبل فريق من المتخصّصين في صناعة 
أخشاب الغابات لتوفير التقدِّم التقني في قطاع Silvaris cs aJ algas co dl‏ 
Dol‏ منصة للتجارة الإلكترونية في الولايات المتحدة الأمريكية خصيصاً لمنتجات الغابات» 
ويقع مقرّها الرئيس في سياتلء واشنطن. وهي شركة رائدة في مجال توفير المنتجات 
الخشبية الصناعية وفائض مواد البناء. 
تقوم 811۷s‏ ببَيْع منتجاتها وثقذّم خدمات لوجيستية دولية إلى أكثر من ١0٠٠‏ 
عميل. ولإدارة مختلف العمليات ذات الصّلة بالمعاملات؛ أنشأت منصة تداول عبر الإنترنت 
بحقوق ملكية لتتبع تدفق المعلومات المتعلّقة بالمعاملات بين التجار والمحاسبة والائتمان 
والخدمات اللوجستية. وقد أتاح ذلك للشركة تبادل المعلومات بشكلٍ فوري مع عملائها 
والشركاء. ولكن نظراً للتغير السريع في أسعار الممواد؛ أصبح من الضروري أن تحصل 5لعة5111 
على عرض فوري للبيانات دون الحاجة إلى نقل وتنسيق البيانات في تقرير منفصل. 
وبدأت ئ بالاستعانة بشركة تابلوه (ناه©181)؛ لقدرتها على التواصل مع 
البيانات الحية وتصويرها. وبسبب لوحات المعلومات التي (Tableau) ogbb plisi‏ 
والتي تتسم بسهولة الفهم والشرح؛ بدأت 15 باستخدام تابلوه (ناهعاطة1) 
لأغراض إعداد التقارير. وساعد ذلك 51173515 في سحب المعلومات بسرعة من البيانات 
وتحديد القضايا التي تؤثر على أعمالها. ونجحت 511715 في إدارة الطلبات عبر الإنترنت 
مقابل الطلبات الأخرى بمساعدة التقارير التي أنشأتها تابلوه (1816810). والآن؛ تقوم 
55 بتتبّح الطلبات عبر الإنترنت المقدمة من قبل العملاء وتعرف متى ترسل دفعات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري o4‏ 


الفصل الأول 


تجديد للعملاء الذين يقومون بالشراء عبر الإنترنت. وأيضاً يمكن بلحللي 5117815 توفير 
الوقت من خلال توليد لوحات معلومات بدلاً من كتابة مئات الصفحات من التقارير 
باستخدام تابلوة (نتهعاطة1). 

أسئلة للمناقشة: 

-١‏ ما التحدي الذي واجهته 51192515؟ 

-Y‏ كيف حلت 15,ه5117 مشكلتها باستخدام تصوير البيانات مع تابلوه (ناهءااة1)؟ 

ماذا يمكننا أن نتعلم من هذه الحالة العملية: 

تحتاج العديدٌ من الصناعات إلى تحليل البيانات بشكل فوري. ويتيح التحليلٌ 
الفوري للمحللين تحديد القضايا التي تؤثر على أعمالهم. ويكون التصويرٌ أحيانًا أفضل 
طريقة لبدء تحليل تيارات البيانات الحية. kn‏ تابلوه (ننهءاطة]) إحدى أدوات 
تصوير البيانات ذات القدرة على تحليل البيانات الحية دون نقل البيانات الحية إلى 
تنسيق 'كقارين xia‏ 
Sources: Tableau.com, "Silvaris Augments Proprietary Technology Platform with‏ 
Tableau's Real-Time Reporting Capabilities" http://www.tableau.com/sites/default/‏ 
files/case-studies/silvarisbusiness-dashboards 0.pdf (accessed July 2016); Silvaris.‏ 

com, "Overview; http://www.;silvaris.com/About/(accessed July 2016). 
۳-١ حالة عملية‎ 
التكلفة باستخدام تصوير البيانات‎ ÅS (Siemens) yuo åS 

(Siemens) js a d 5,‏ هي شركة أمانية مقرّها في Aul acd»‏ وهي إحدى 
كبرى الشركات في العالم التي E‏ على مجالات الكهرباءء. والسيارات» والرقمنة. 
وتحقق إيرادات سنوية تبلخ ۷١‏ مليار يورو. 

LAS as‏ مجموعة التحليلات المرئية لشركة سيمنس (51672625) بحلول التقارير 
الشاملة والاستشارات فيما يتعلق بجميع احتياجات ذكاء الأعمال الداخلية لشركة سيمنس 
(Siemens)‏ وكانت هذه المجموعة تواجه تَحَذَياً متمثلاً في توفير حلول إعداد التقارير إلى 
منظمة سيمنس (51673685) بالكامل عبر الأقسام المختلفة مع الحفاظ على التوازن بين قدرات 
الحوكمة والخدمة الذاتيةء وكانت شركة سيمنس (5162685) بحاجة إلى منصة d‏ من 
تحليل الحالات المتعددة لاستطلاعات آراء العملاء والعمليات اللوجيستيةء وإعداد التقارير 


Vw‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


المالية. وكان لا بد أن تكون هذه المنصة سهلة الاستخدام لموظفيها؛ حتى يتمكِّنوا من استخدام 
هذه البيانات للتحليل واتخاذ القرارات. وبالإضافة إلى ذلك؛ يجبٌ أن تتكامل المنصة بسهولة 
مع أنظمة سيمنس (5143685) الحالية» وأن تمنح الموظفين تجربة استخدام سلسة. 

بدأت الشركة في الاستعانة 45525 JsloJ 3l; (ule 355a (125 .Dundas BI‏ ذكاء 
الأعمال وحلول التمثيل (Siemens) jue o ÀS 4) eS ea aa 489 «OUI (S SE‏ 
بإنشاء لوحات معلومات تفاعلية مكّنَّت شركة سيمنس go (Siemens)‏ اكتشاف 
المشكلات مبكرّاء وبالتالي توفير قدرٍ كبيرٍ من المال. وساعدت لوحات ال معلومات التي 
طوّرتها 81 Dundas‏ شركة سيمنس (51672625) على الإجابة عن أسئلة مثل كيف تؤثر 
معدلات العرض المختلفة في المواقع المختلفة على العملية؛ مما ساعدها على تقليل زمن 
دورة الأعمال مقدار £۱١‏ وتكلفة الخردة بنسبة 770. 

أسئلة للمناقشة: 

SASALI CMa (Siemens) guias ما التحديات التي واجهتها مجموعة‎ -١ 


(Siemens) ساعدت أداة تصوير البيانات من 81 10013035 شركة سيمنس‎ AS -Y 
في خفض التكلفة؟‎ 

ماذا ممكننا أن نتعلم من هذه الحالة العملية: 

تحتاج العديدٌ من المنظمات إلى أدوات تمكّنها من تحليل بياناتها ا متوفرة في أقسام 
متعددة» هذه الأدوات تساعد في تحسين أداء عمل المنظمات» وجَعّل عملية اكتشاف 
البيانات شفافة بالنسبة للمستخدمين؛ لتمكينهم من تحديد مشكلات الأعمال بسهولة. 
Sources: Dundas.com, “How Siemens Drastically Reduced Cost with Managed BI‏ 
Applications, http://www.dundas.com/resource/getcasestudy?caseStudyName-09-03-‏ 
2016-SiemensZ2FDundas-BI-Siemens-Case-Study.pdf (accessed July 2016); Wikipedia.‏ 


org, "SIEMENS; https://en.wikipedia.org/wiki/Siemens (accessed July 2016); Siemens. 


com, "About Siemens; http://www.siemens.com/about/en/(accessed July 2016).‏ 
التحليلات التنبؤية: 
تهدف التحليلات التنبؤية إلى تحديد ما يمكن أن يحدث في المستقبل: وتعتمد هذه التحليلات 
على الأماليب الإحصائية بالإضافة إلى الأساليب الأخرى التي تم تطويرها حديًا والتي تندرج 
تحت الفئة العامة التنقيب à‏ البيانات. وتهدف هذه التقنيات إلى القدرة على التنبق بما إذا 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري M‏ 


الفصل الأول 


كان من المرجح أن ينتقل العميلٌ إلى المنافسينء وماذا يجب على العميل شراؤه بعد ذلك وباي 
مقدارء وما هي العروض الترويجية التي قد يستجيبٌُ لها العميل وما إذا كان هذا العميل جديراً 
بالثقة الائتمانية أم لاء وما إلى ذلك. العديدٌ من التقنيات تُستخدّم في تطوير تطبيقات التحليلات 
التنبؤية ها في ذلك خوارزميات التصنيف ال مختلفة. فعلى سبيل ال مثال» وكما سترى في الفصلين 
الراإبع والخامس» هكننا استخدام تقنيات التصنيف مثل الانحدار اللوجستيء ونماذج شجرة 
القرارات» والشبكات العصبية للتنبق بمدى جودة الصور المتحركة أمام شباك التذاكر. ويمكننا 
أيضاً استخدامٌ خوارزميات التجميع لتقسيم العملاء إلى مجموعات مختلفة؛ حتى يكون بالإمكان 
استهدافهم بعروض ترويجية مُحدَّدة لهم. وأخيرا؛ يمكننا استخدامٌ أساليب الترابط في المجتمعات 
لتقدير العلاقات بين السلوكيات الشرائية المختلفة: أيْ: إذا اشترى أحد العملاء منتجًا ما؛ فما 
الذي قد يشتريه العميل أيضاً؟ يمكن أن يساعد هذا التحليل بائع التجزئة في التوصية أو الترويج 
للمنتجات ذات الصلة. على سبيل المثال؛ فإن أي بحث ais gu Amazon.com de gus js‏ 
أن يقترح بائعٌ التجزئة أيضاً منتجات مشابهة أخرى قد يهتم بها العميل. وسنقوم بدراسة هذه 
الأساليب وتطبيقاتها في الفصول من الثالث إلى السادس. وتوضّح الحالة العملية 6-١‏ إحدى هذه 
التطبيقات في الألعاب الرياضية. 
dll»‏ عملية 6-١‏ 
تحليل الإصابات الرياضية 
إن أيّ نشاط رياضي يكون عُرضةً لوقوع إصابات وإذا لم يتم التعامل مع الإصابات 

بشكل صحيح؛ فقد يتضرّر الفريق. ويمكن أن يساعد استخدام التحليلات لفهم الإصابات 

في الحصول على إحصاءات قيّمة من شأنها تمكين المذربين وأطباء الفريق من إذازة 

تكوين الفريق» وفهم قدرات اللاعبين» والمساعدة في نهاية المطاف في اتخاذ القرارات 

الأفضل بشأن اللاعبين الذين ربما يكونوا متاحين للعب في أيّ وقت. 

وفي دراسة استطلاعية؛ قامت جامعة أوكلاهوما الحكومية بتحليل الإصابات 

الرياضية بكرة القدم الأمريكية باستخدام التقارير والتحليلات التنبؤية. واتبع المشروع 

CRISP-DM irgo‏ (التي سنعرضها في الفصل الرابع)؛ لفهم مشكلة تقديم توصيات 

بشأن إدارة الإصابات» وفهم عناصر البيانات المختلفة التي تم جمعها حول الإصابات 

وتنظيف البيانات وتطوير تصويرات لجذب استدلالات مختلفة وبناء تحليلات إدارة 

الأداء لتحليل فترة التئام الجروح» وقواعد تسلسل الرسم؛ للتنبؤ بالعلاقات بين الإصابات 

ومختلف أجزاء الجسم المصابة بالإصابات. 


Ww‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


وتتألف مجموعة بيانات الإصابات من أكثر من ٠٦١‏ سجل إصابة في كرة القدم 
والتي تمَّ تصنيفها في إطار المتغيرات الخاصة بالإصابة إلى: الجزء من الجسم/ موقع 
الجسم/ الشكل الجانبيء والإجراء ا متخذ, والشّدةء نوع الإصابة: بداية الإصابة وتواريخ 
الشفاءء والمتغيرات الخاصة باللاعب/ الرياضة إلى: بطاقة تعريف اللاعب» ومركز اللاعب 
ف امملعب» والنشاط والبداية وموقع ال مباراة. وتم حسابُ وقت الشفاء من الإصابة لكل 
سجل؛ إذ تم تصنيفها إلى مجموعات مختلفة من الفترات الزمنية: ١-١‏ شهرء ۲-۱ شهرء 
۴ أشهن غ12 أشهر و أشهر- ١‏ شهرا: 

وتم إنشاءً تصويرات مختلفة؛ لاستنتاج معلومات من مجموعة بيانات الإصابات التي 
تصؤر فترة الشفاء ابمرتبطة Sl‏ اللاعبين وشدة الإصابات وفترة الشفاء والعلاج اممقدّم 
والفترة الزمنية للشفاء المرتبطة بهاء والإصابات الكبيرة التي تصيبٌ أجزاء الجسم وما إلى ذلك. 

وتم بناءٌ نماذج الشبكات العصبية لكل فئة من فئات الشفاء باستخدام 
IBM SPSS Modeler‏ وكان من المتغيرات المتوقعة: الحالة الراهنة للإصابةء الشدة 
جزء الجسم» موقع الجسم» نوع الإصابة» النشاطء موقع الحدثء الإجراء المتخذء والموقف. 
وكان نجاح تصنيف فئة الشفاء جيداً جداً؛ إذ كانت الدقة 19,7/. وبناءً على التحليل تم 
اقتراح العديد من توصيات الأعمال؛ منها استخدامٌ المزيد من مُدخلات المختصين من بداية 
الإصابة بدلاً من السماح لموظفي غرفة التدريب بفحص اللاعبين المصابين. وتم تدريبُ 
اللاعبين في المراكز الدفاعية لتجنب الإصابة» وممارسة التدريب على آليات فحص السلامة. 

أسئلة للمناقشة: 

-١‏ ما هي أنواع التحليلات المطبّقة في تحليل الإصابات؟ 

؟- كيف تساعد التصويراتُ في فهم البيانات وتقديم رؤى إلى البيانات؟ 

- ما هي مشكلة التصنيف؟ 

ع- ما الذي يمكن اشتقاقه عن طريق إجراء تحليل تتابعي؟ 

ما الذي يمكننا تعلّمه من هذه الحالة العملية؟ 

وبالنسبة لأيّ مشروع تحليلات؛ من المهمَ دائماً فهم نطاق الأعمال والحالة الراهنة 
لمشكلة الأعمال من خلال تحليل مُوسَّع للمورد الوحيد وهو البيانات التاريخية. وغالباً 
ما توفر عمليات التصوير sl; lal dl‏ لاكتساب الأفكار الأوّلِية للبيانات» والتي يمكن 
تحسينها بشكل أكبر استنادًا إلى آراء الخبراء لتحديد الأهمية الجوهرية لعناصر البيانات 
ذات الصّلة با مشكلة. كما تساعد المعلومات المرئية في توليد أفكار لمشكلات غامضة:» والتي 

ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري w‏ 


الفصل الأول 


يمكن متابعتها في بناء رؤى إدارة PS‏ والتي يمكن أن تساعد المنظمات فى صنع القرار. 
Source: Sharda, R., Asamoah, D., & Ponna, N. (2013). “Research and Pedagogy in‏ 
Business Analytics: Opportunities and Illustrative Examples.” Journal of Computing‏ 
and Information Technology, 21(3), 171182-.‏ 


التحليلات التوجيهية: 

تُسمّى الفئة الثالثة من التحليلات بالتحليلات التوجيهيةء والتي تهدف إلى التعرف على ما يجري 
بالإضافة إلى التوقعات المحتملة واتخاذ القرارات؛ لتحقيق أفضل أداء ممكن. وقد تمت دراسة هذه 
المجموعة من الأساليب تاريخيًا تحت مظلة التقارير التشغيلية أو علوم الإدارة» وتهدف بشكلٍ عام 
إلى تحسين أداء النظام. والهدف هنا هو تقديم قرار أو توصية بخصوص إجراء مُحدَّد. وقد تكون 
هذه التوصيات على شكل (نعم/ لا) لاتخاذ قرار مرتبط بشكلٍ مُحدَّد لكل مشكلة؛ أو مبلغ معين 
(على سبيل المثال: سعر بند معين أو سعر الشحن). أو مجموعة كاملة من خطط الإنتاج. وقد تُعرّض 
القرارات على صانع القرار في تقرير أو يمكن استخدامها مباشرةً في نظام قواعد القرار الآلي (كما هو 
الحال في أنظمة تسعير شركات الطيران). وبالتالي؛ يمكن أيضاً تسمية هذه الأنواع من التحليلات 
بتحليلات القرار أو التحليلات المعيارية. وثقدّم الحالة العملية ٠,١‏ مثالاً على مثل هذه التطبيقات 

التحليلية المسبقة» وسوف نتعرف على بعض جوانب التحليل التوجيهي في الفصل السادس. 

حالة عملية 0-١‏ 
شركة ستيل بار (83 5]661) المتخصصة تستخدم التحليلات لتحديد تواريخ تنفيذ 
التزاماتها وفقاً للموارد المتاحة 

هذه الحالة العملية مرتبطة بنا جميعاً؛ فقد كانت شركة ستيل بار (Steel Bar)‏ 

لا ترغب في الكشف عن اسمها (أو حتى مجال عملها الدقيق) تواجه مشكلة كبرى 

تتمثل في اتخاذ القرارات بشأن مخزون المواد الخام الذي تستخدمه لإرضاء العملاء؛ 

إذ تقوم هذه الشركة بتوفير قضبان حديدية مُخصّصة لعملائها. وقد تقوم بتقطيع 

القضبان إلى أشكال أو أحجام مُحدَّدة وقد تحتوي على مواد فريدة ومتطلبات تشطيب؛ 

إذ تقوم الشركة بشراء المواد الخام من جميع أنحاء العام وتخزينها في مستودعهاء 

وعندما يتصل عميلٌ محتمل بالشركة لطلب عرض أسعار القضبان المتخصصة وما يرتبط 

بذلك من بيانات (التكوينء أصل اممعدنء الجودة, الأشكالء الأحجام... إلخ)» وعادةً ما 

يكون لدى مندوب المبيعات قليلٌ من الوقت لتقديم مثل هذا السعر بما في ذلك التاريخ 

الذي يمكن فيه تسليم المنتج ويطبيعة الحالء الأسعار» وما إلى ذلك. ومن ثم يجبُ اتخاذ 


w‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


قرارات بشأن الوفاء بالالتزامات التاريخية» والتي تُحدَّد في الوقت ا مناسب التواريخ التي 
يمكن أن يتمّ تسليمٌ ا منتجات التي طلبها العملاء. ويُطلّب من مندوب المبيعات Šal‏ 
مثل هذه القرارات من خلال تحليل التقارير حول المخزون اممتاح للمواد الخام. وقد 
تكون بعض المواد الخام المتوفرة قد التزم المندوب بالفعل بتسليمها؛ تلبية لطلب عميل 
آخر. وبالتالي؛ قد لا يكون المخزون الموجود في المخزن متاحاً بالفعل. ومن ناحية أخرى؛ 
قد تكون هناك مواد خام من المتوقع تسليمها في المستقبل القريبء ويمكن استخدامها 
أيضاً لتلبية طلب مُقدَّمِ من هذا العميل المحتمل. وأخيرا قد تكون هناك فرصة أيضاً 
لتحصيل رسوم على طلب جديدٍ عن طريق إعادة تخصيص المخزون الذي تم الالتزامٌ 
به مسبقاً لتلبية هذا الطب الجديد مع تأجيل الطلب الذي تم الالتزامٌ به بالفعل. 
وبالطبع؛ فإنه يجب أن تستند هذه القرارات على تحليل التكلفة والعائد لتأخير طلب 
سابق. وبالتالي؛ يجب أن يتمكن النظام من سحب البيانات بشكلٍ لحظي من بيانات 
المخزونء والطلبات المجمّعة, واممواد الخام الواردة» وقيود الإنتاج» وما إلى ذلك. 
ولدعم هذه القرارات الصادرة بناءً على الوعد وفقاً للمتاح؛ تمّ تطويرٌ نظام دعم 
القرار 855 الفوري؛ من أجل تخصيصٍ أمثل للمخزون المتاح ولدعم تحليل ماذا - لو 
الإضافي. ويستخدم نظام دعم القرار مجموعةً من نماذج البرامج المختلطة والتي يتم 
حلّها باستخدام البرامج التجارية. كما أدرجت الشركة نظام دعم القرار في نظام تخطيط 
موارد المؤسسة الخاصة بها لتسهيل استخدامها لتحليلات الأعمال. 
أسئلة للمناقشة: 
-١‏ اذا تُعَذّ إعادةٌ تخصيص المخزون من عميل إلى آخر؛ قضيةً رئيسةً للمناقشة؟ 
۲- كيف يكن أن تساعد أنظمة دعم القرار في اتخاذ هذه القرارات؟ 
Source: Pajouh Foad, M., Xing, D., Hariharan, S., Zhou, Y., Balasundaram, B.,‏ 
Liu, T., & Sharda, R. (2013). “Available-to-Promise in Practice: An Application of‏ 
Analytics in the Specialty Steel Bar Products Industry.” Interfaces, 43(6), 503517-.‏ 
http://dx.doi.org/10.1287/inte.2013.0693 (accessed July 2016).‏ 
التحليلاث المطبّقة على المجالات المختلفة: 
لقد أنتجت تطبيقاث التحليلات في قطاعات الصناعة امختلفة العديد من المجالات ذات UAI‏ 
أو على الأقل التعبيرات الشائعة اليوم. ومن المألوف تقريباً أن نربط كلمة تحليلات بأيّ صناعة 
أو بيانات وبالإضافة إلى التصنيف العام لتحليلات النص» والتي تهدف إلى الحصول على قيمة من 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 10 


الفصل الأول 


النص (سيتم دراستها في الفصل الخامس»» أو تحليلات الويب والتي تهدف إلى تحليل بيانات 
الويب؛ فقد تمَّ تطويرٌ العديد من التحليلات المتعلقة بمشكلة أو صناعة معينة. كما تمّ تطوير 
التحليلات الخاصة بالعديد من المهن/ المجالات الخاصة بالصناعة أو المسائل الخاصة بالمشكلات. 
ومن أمثلة هذه المجالات تحليلاتٌ التسويقء وتحليلات التجزئةء والنظريات الاحتياليةء وتحليلات 
النقل والتحليلات الصحيةء والتحليلات الرياضيةء وتحليلات المواهب. والتحليلات السّلوكية» وما 
إلى ذلك. فعلى سبيل المثال: قدَّم القتسم ١-١‏ عبارة التحليلات الرياضية. ويمكن أيضاً تسمية 
الحالة العملية ١-١‏ دراسة حالة في تحليلات شركات الطيران. وسيِّقدَّم القسم التالي التحليلات 
الصحية وتحليلات السوق على US‏ واسع. وبمعنى دقيق يتم تصنيف أي dalos‏ منهجي 
للبيانات في قطاع معين على أنه تحليلات Sal)»‏ الفراغات)». وعلى الرغم من أن هذا قد يؤدي 
إلى زيادة حجم مفهوم التحليلات؛ فإنَّ الفائدة هي أن المزيدَ من الناس في صناعات مُحدّدة 
سيدركون قوة وقدرات التحليلات. كما يدفع إلى التركيز على المتخصصين الذين يطوّرون ويطبّقون 
مفاهيم التحليلات في قطاع رأسي. وعلى الرغم من أنَّ العديد من الأساليب لتطوير تطبيقات 
التحليلات قد تكون شائعة؛ فان هناك مشكلات فريدة في [S‏ شريحة عمودية تؤثر على كيفية 
جمع البيانات» ومعالجتهاء وتحليلهاء وتنفيذ التطبيقات. وهكذا؛ فإِنَّ التمييز بين التحليلات 
المستندة إلى التركيز العمودي؛ مفيدٌ للنمؤٌ الإجمالي للانضباط. 
التحليلات أو علم البيانات: 

حتى في الوقت الذي يحظى فيه مفهومٌ التحليلات بمزيد من الاهتمام في دوائر الصناعة والأوساط 
الأكاديمية؛ تمَّ dial‏ مصطلح آخر وأصبح شائعاً وهو مصطلح علم البيانات» والممارسون لهذا العلم 
يُطلق عليهم «علماء بيانات»: وأحياناً يُنسَبِ إنشاء مصطلح علم البيانات إلى باتيل (D. J. Patil)‏ 
LinkedIn 5a‏ وكانت هناك بعض المحاولات لوصف الاختلافات بين مُحلَلِي البيانات وعلماء 
emc.com/collateraliaboutinews/emc-data-science- : , 3| JULI Jis (Ae) 5l‏ 
los OI eSI eds 5 .(study-wp.pdf‏ البيانات هو مجرد مصطلح آخر للمهنيين الذين كانوا 
يقومون بعمليات ذكاء الأعمال في شكل تجميع البيانات وتنظيفها وإعداد التقاريرء وأحياناً بعض 
التصويرء وتشمل مجموعات مهاراتهم» وشملت مجموعات مهاراتهم إكسل Excel‏ وبعض معارف 
SQL‏ وإعداد التقارير. ويمكنك التعرّف على هذه القدرات على أنها تحليلات وصفية أو تقارير. 
وعلى النقيض من ذلك؛ فإنَّ عالم البيانات مسؤولٌ عن التحليل التنبؤي والتحليل الإحصاقء والأدوات 
التحليلية والخوارزميات الأكثر تقدماً. وقد يكون لديه معرفةٌ أعمق بالخوارزميات وقد تحت 
تصنيفات مختلفة كالتنقيب ف البيانات» أو اكتشاف المعرفةء أو تعلّم الآلة. وقد يحتاج بعض هؤلاء 


11 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


الباحثين إلى معرفة برمجة أكثر عمقاً؛ ليكونوا قادرين على كتابة الكود لتنظيف/ تحليل البيانات 
في اللغات الحالية المعتمدة على الويب. مثل لغة 394[ أو 5("05, واللغات الإحصائية مثل R‏ 
كما يحتاج العديدٌ من محترفي التحليلات إلى بناء خبرة كبيرة في النمذجة الإحصائية, والتجريب» 
والتحليل. ومرةً أخرى؛ ينبغي أن يدرك قراؤنا أن هذه المصطلحات تندرجُ تحت مظلة التحليلات 
التنبؤية والتوجيهية. ومع ذلك؛ تشتمل أيضاً التحليلات التوجيهية على خبرات أكثر أهمية في تقارير 
التشغيل بما في ذلك الأمثلية والمحاكاة وتحليل القرار وما إلى ذلك. ومن المرجّح أن يطلق على أولئك 
الذين يعملون على هذه الحقول علماء البيانات بدلاً من محترفي التحليلات. 

إِنَّ وجهة نظرنا في التمييز بين التحليلات وعام البيانات تكمَنْ في درجة المعرفة والمهارات الفنية 
أكثر من الوظائف. galz Í gaug‏ علوم الحاسوب والإحصاء والرياضيات التطبيقية تفضّل تسمية 
علم البيانات» مع الاحتفاظ بتسمية التحليلات الخاصة با مهنيين العاملين بشكل أكبر. وكمثال 
آخر على ذلك؛ اقترح المتخصصون في الفيزياء التطبيقية استخدام علم الشبكة كمصطلح لوصف 
التحليلات التي تتعلق بمجموعات من الناس؛ كالشبكات الاجتماعيةء وشبكات سلاسل التوريدء 
وما إلى 43 coU ule gb) http://barabasi.com/networksciencebook/ : 1l‏ دراسي 
متطوّر حول هذا ا موضوع. 

وإذا صرفنا النظرَ عن الاختلاف الواضح في مجموعة المهارات الذي يمتلكها مَنْ يقومون بإجراء 
تحليلات وصفية وإعداد التقارير فقط مقابل أولئك الذين ينخرطون في القيام بأنواع التحليلات 
الثلاثة؛ فإن التمييز بين مصطلح التحليلات وعلم البيانات يصبح غامضاً. ونلاحظ أن خريجي 
برامج التحليلات لدينا يكونون مسؤولين عن مهام تتوافق بشكلٍ أكبر مع مهام علماء البيانات» 
وليس مجرد فقط تقديم تقارير تحليلية. هذا الكتاب يهدف بوضوح إلى إدخال قدرات ووظائف 
جميع أنواع التحليلات» والتي تشمل علم البيانات وليس مجرد تقارير التحليلات» ومن الآن 
فصاعداً سنستخدمٌ التحليلات وعلم البيانات بشكل متبادل. 
أسئلة مراجعة على القسم :0-١‏ 
-١‏ عرّف التحليلات. 
۲- ما هي التحليلات الوصفية؟ وما هي الأدوات المتنوّعة المُستخدّمة في التحاليل الوصفية؟ 
-Y‏ كيف تختلف التحليلات الوصفية عن التقارير التقليدية؟ 
ع- ما هو مستودع البيانات؟ وكيف يمكن لتقنية مستودعات البيانات المساعدة في تمكين التحليلات؟ 
-٥‏ ما هي التحليلات التنبؤية؟ كيف يمكن للمنظمات استخدامٌ التحاليل التنبؤية؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ww‏ 


الفصل الأول 


1 ما هي التحليلات التوجيهية؟ ما هي أنواع المشكلات التي يمكن حلَّها عن طريق التحليلات التوجيهية؟ 
/ا- عرّف النمذجة من منظور التحليلات. 

- هل من الجيد اتباع التسلسل الهرمي للتحليلات الوصفية والتنبؤية قبل تطبيق التحليلات التوجيهية؟ 
9- كيف يمكن أن تساعد التحليلات في اتخاذ القرار الموضوعي؟ 


-١‏ أمثلة على التحليلات في مجالات مختارة: 


في الفصول المتنوّعة لهذا الكتاب سنتطرّق للعديد من أمثلة تطبيقات التحليلات: وهذا هو 
أحد الطرق الرئيسة المُستَخدّمة في هذا الكتاب (التعرض - 6تنادهم:8). في هذا القسم سنلقي 
الضوء على مجالين من المجالات المهمة لتطبيق التحليلات والتى حققت نجاحاً ملحوظاً؛ وهما: 
الرعاية الصحية: وبيع التجزئة. : 
تطبيقات التحليلات في الرعاية الصحية - :Humana àlsi‏ 

على الرغم من أنَّ تحليلات الرعاية الصحية تُغطّي مجموعةً واسعةً من التطبيقات من الوقاية 
إلى التشخيص إلى العمليات الفعّالة ومَنْع الاحتيال؛ فإننا نركّز على بعض التطبيقات التي تم 
تطويرّها في شركة تأمين صحي رئيسة: ووفقاً لما ذكره موقع الشركة على الإنترنت: «تتكامل 
إستراتيجية الشركة لتقديم الرعايةء وتجربة الأعضاء» والرؤى الإكلينيكية ورؤى المستهلك؛ بهدف 
تشجيع المشاركة» وتغيير السلوك والتواصل الإكلينيكي الاستباقي والتعافي». وينطوي تحقيق هذه 
الأهداف الإستراتيجية على استثمارات كبيرة في تقنية المعلومات بشكلٍ عام؛ والتحليلات بشكلٍ 
خاص. إِنَّ Brian LeClaire‏ 52 نائب الرئيس ورئيس قسم ال معلومات في ag Humana‏ شركة 
تأمين رئيسة في الولايات المتحدة. وحاصلٌ على الدكتوراه في 2115 من جامعة أوكلاهوما. وقد 
دافع عن التحليلات كمؤثر تنافسي في Humana‏ كما شارك في إنشاء مركز للتميّز في التحليلات. 
ووصف المشاريع التالية بأنها أمثلة على مبادرات 212813 في نطاق التحليلات التي يقودها 
Vipin Gopal‏ ;5 التحليلات الإكلينيكية في 111222. 
مثال١:‏ منع حوادث سقوط كبار السن - مدخل تحليلي: 

تُعَدَّ الإصابة نتيجةٌ للسقوط خظراً ضحيًا كبيراً لكبار السن الذين يبلغون من العمر 30 غامًا؛ 
فهم أكثر من ثلث من يصابون في حوادث سقوط كل عام”". إن حوادث السقوط هي أيضاً 
العامل الرئيس لكل من الإصابات القاتلة وغير المميتة بالنسبة لكبار السن؛ إذ يؤدي ذلك إلى 
زيادة خطر الإعاقة بنسبة تصل إلى 20١‏ . 


v‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


JS as‏ تكاليفٌ هذه الإصابات عبئاً كبيراً على نظام الرعاية الصحية بالولايات المتحدة 
الأمريكية؛ إذ بلغت التكاليف المباشرة للسقوط بنحو ١6‏ مليار دولار في عام ۴٠١۲م‏ وحده. ومع 
ارتفاع النسبة المئوية لكبار السن في الولايات المتحدة؛ فمن المتوقع أن تتزايد حوادث السقوط 
والتكاليف المرتبطة بها. ووفقاً لمراكز التحكم في الأمراض والوقاية منها (0100)؛ فإنَّ «حوادث 
السقوط هي مشكلةً صحيةٌ عامة يمكن منعها إلى Jes Ae‏ 

qilî Humana id‏ أكبر مورد لرنج Medicare Advantage‏ الذي des‏ حوالي ۳۲ ملیون 
عضوء معظمهم من كبار السن. إِنَّ الحفاظ على أعضائها البارزين ومساعدتهم في العيش بأمان 
في منازلهم؛ هو هدفٌ تجاري رئيس؛ إذ يُعَدٌ منعٌ حوادث السقوط مكسباً مهماً. ومع ذلك؛ لم 
تكن هناك منهجيةٌ صارمةٌ لتحديد الأفراد الأكثر عرضةً للسقوط والذين تُعَذ جهود الوقاية مفيدة 
لهم. وعلى عكس الحالات الطبية المزمنة مثل السكري والسرطان؛ فإنَّ السقوط ليس حالةً iub‏ 
واضحة المعالم. وبالإضافة إلى ذلك؛ لا يتم الإبلاغ عن حالات السقوط عادةً في بيانات المطالبات؛ 
نظراً لأن الأطباء يميلون في الغالب إلى ترميز نتائج السقوطء مثل: الكسور والاضطرابات. وعلى 
الرغم من وجود العديد من التقييمات التي تتم إدارتها إكلينيكيًا لتحديد وجود المتعثرين؛ فإنها لا 
تصل إلا لعدد محدود من الحالات وتفتقر إلى طاقة فعلية كافية. وعلى هذا النحو؛ فهناك حاجةٌ 
إلى طريقة مستقبلية دقيقة لتحديد الأفراد الأكثر عُرضةً لخطر السقوط؛ حتى يتمكنوا من اتخاذ 
إجراءات استباقية لمنع السقوط. وقد أجرى التحليل الإحصائي لشركة 1110828 عملية تطوير 
نموذج تنبؤي بحوادث السقوط. وهذا هو أول تقرير رسمي شامل يستفيدٌ من المطالبات الطبية 
والصيدلية الإدارية» والبيانات الإكلينيكية: والأنماط الإكلينيكية المؤقتة. ومعلومات المستهلك: 
وغيرها من البيانات لتعريف الأقراد اللمعرّضين لخطر السقوط في نطاق زمني مُحدّد. 

de (Humana) blogas حالياً عنصراً أساسياً لقدرة شركة‎ (PM Falls) jJlà el g äi b i s 
تحديد كبار السن الذين بإمكانهم الاستفادة من التدخلات للتخفيف من سقوطهم. تحديد كبار‎ 
السّن الذين يمكنهم الاستفادة من تدخلات التخفيف من السقوط. وقد أظهر برهانٌ مبدأيّ للمفهوم‎ 
الذين هثلون ال ۲ الأعلى ضمن مخاطر السقوط؛ أنَّ عددّ المستفيدين من‎ 11۵١٩ مع مستهلكي‎ 
لتقليل مخاطر‎ Ile colla خدمات العلاج الطبيعي قد ارتفع» مشياً إلى أنَّ المستهلكين يتخذون‎ 
السقوط. وهناك مبادرةٌ ثانيةٌ تستخدم طريقة 158115 53 لتحديد الأفراد ا معرّضين للخطر حتى‎ 
مستهلك‎ 7١.٠٠١ كنت 111034 من تحديد‎ PM يخضعوا لبرامج المراقبة عن بُعد. وباستخدام‎ 
تعرّضوا لخطر السقوطء وهم الذين استفادوا من هذا البرنامج. ويرتدي المستهلكون الذين تمّ‎ 
تحديدهم جهازاً يكتشف السقوط وينبّه المستهلك طُوال اليوم وعلى مدار الأسبوع للمساعدة الفورية.‎ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 33 


الفصل الأول 


وحصل هذا العمل JUsMI 8jlay Kelly 4JS (L3 (54 Analytics Leadership 853t- (e‏ 
بجامعة 100138 في عام 010؛ وذلك لتبئّيه أساليب التحليل في بيئة العمل. 


مثال؟: هدف هيومانا الجريء - تطبيق التحليلات لتحديد المقاييس المناسبة: 


في عام PYNE‏ أعلنت ge Humana åS‏ هدف المنظمة الجريء لتحسين صحة ال مجتمعات 
المحلية بنسبة <۲١‏ بحلول عام ١٠٠۲م‏ من خلال تسهيل الأمر لتحقيق أقصى درجات الصحة. ويمكن 
تعريف اب مجتمعات التي تخدمها alto Sas Shs Humana‏ (الولايةء المدينةء الحي)» وحسب 
Medicare Advantage gol) gahl‏ الخطط القائمة على صاحب العملء الخدمات المشتراة بشكلٍ 
فردي)» أو عن طريق الملف الإكلينيي (شروط الأولوية بما في ذلك مرض السكريء ارتفاع ضغط الدم, 
05158 [فشل القلب الاحتقاني]ء CAD‏ [مرض الشريان التاجي]» COPD‏ (مرض الانسداد الرئوي 
المزمن) أو ”الاكتئاب“. إِنَّ فهم صحة هذه المجتمعات وكيفية تتبّعها بمرور الوقت؛ أمرٌ بالغ الأهمية 
ليس فقط لتقييم الهدف؛ ولكن أيضاً في صياغة إستراتيجيات لتحسين الصحة العضوية في مجملها. 
وكان التحَدّي أمام منظمة التحليلات يتمثل في تحديد مقياس يرز جوهر الهدف الجريه؛ OS‏ 
مقاييس التأمين الصحي التقليدية امقاسة موضوعيًاء مثل القبول في المستشفيات أو زيارات غرف 
الطوارئ لكل ٠٠٠١‏ شخص لن تنهض هذه المهمة الجديدة. وكان الهدف هو تحديدٌ المقياس 
الذي يحافظ عليها ويُحسّنها في المجتمع؛ ولكن يجب أن يكون مرتبطاً بأعمال شركة هيومانا 
ss (Humana)‏ خلال تقييمات تحليلية صارمة؛ اختارت 110123118 في نهاية ا مطاف ”الأيام 
الصحية“؛ وهو عبارة عن استبيان من أربعة أسئلةء عن جودة الحياةء وقد تم تطويره من قبل 
مركز التحكم في الأمراض لتتبع وقياس تقدّمهم نحو تحقيق الهدف الجريء. 
كان من الضروري التأحّد من أن المقياس المُحدّد يرتبط ارتباطاً كبيراً مقاييس الصحة والأعمال؛ 
بحيث يؤدي أي تحسّن في الأيام الصحية إلى تحسين الصحة. وإلى نتائج أعمال أفضلء وتتضمّن 
الأمثلة التالية كيفية ارتباط ”الأيام الصحية“ بمقاييس الاهتمام: 
- يظهر الأفراد الذين لديهم أيام غير صحية أكثر استخداماً وأنماط تكلفة عالية. لكلّ ه أيام غير 
صحية إضافية هناك: 
(T)‏ 8265 قدرها ۸۲ دولاراً في متوسط التكاليف الطبية والصيدلية الشهرية. 
(ب) زيادة قدرها 07 دخولاً للمستشفیات لکل ٠۰۰۰‏ مريض. 
(ج) زيادة ٠,۲۸‏ يوماً في متوسط مدة البقاء. 


v.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


- الأفراد الذين يُظهرون سلوكيات سليمة وظروفهم المزمنة تدار بشكلٍ جيد لديهم عدد أيام غير صحية 
«Ji‏ على سبيل المثال: الأفراد المصابون بمرض السكري لديهم عدةٌ أيام غير صحية أقل إذا حصلوا على 
فحص الدهون السيئة أو فحص العين السكرية وباممثلء إذا كان هناك تحكم في مستويات السكر في الدم. 
- الأفراد الذين يعانون من الأمراض المزمنة لديهم عدد أيام غير صحية أكثر ممَّن ليس لديهم 
حالات مزمنة ومنها: مرض السكريء ارتفاع ضغط الدم: :1157© [فشل القلب الاحتقاني]» CAD‏ 
[مرض الشريان التاجي]. ٥0۲5‏ (مرض الانسداد الرئوي المزمن) ”أو الاكتئاب”. 
ومنذ ذلك الحينء اعتمدت 113283 الأيام الصحية كمقياس لها لقياس التقدِّم نحو تحقيق 
هدفها الجريء. 
مثال؟: نماذج تنبؤية لتحديد أعلى نسبة من المخاطر في شركة تأمين صحي: 
تنطبق قاعدة ۸٠/٠١‏ بشكل عام على الرعاية الصحية» وتعني أنَّ حوالي “7٠١‏ من المرضى 
يستهلكون ۸٠0‏ من موارد الرعاية الصحية؛ بسبب حالتهم الصحية المتدهورة أو المزمنة. 
إِنَّ تحديد الأعضاء المناسبين أمرٌ حاسم في التسجيل في الرعاية الصحية: وفي السنوات الأخيرة تمّ 
تطويرٌ أنظمة لإدارة الأداء تقوم بتحديد المُسجَّلِين الأعلى مخاطر في المستقبل. كما تمّ تطويرٌ العديد 
من أنظمة إدارة الأداء هذه مع الاعتماد الكبير على بيانات المطالبات الطبية» والتي تنتج عن الخدمات 
الطبية التي يستخدمها المسجلون. بسبب التأخر الموجود في تقديم بيانات المطالبات ومعالجتهاء 
هناك تأخر مماثل في تحديد الأعضاء المعرضين بلخاطر عالية للتسجيل ق البرامج السريرية» وهذه 
المسألة ذات أهمية خاصةً عندما ينضمُ أعضاء جُدُّد إلى شركة تأمين صحي كون ليس لديهم تاريخ 
مطالبات صحي مع شركات تأمين أخرى. يمكن أن يستغرق مُقدَّم الطلب الذي يعتمدُ على المطالبات 
في المتوسط 17-4 شهراً بعد تسجيل أعضاء جُدُّد لتحديدهم للإحالة إلى البرامج الإكلينيكية. 
في أوائل العقد الجاري جذبت شركة هيومانا العديدَ من الأعضاء الجُدُّد من خلال منتجات 
(Medicare Advantage) qzilàs! 5:42‏ وبالتالي احتاجت إلى طرق أفضل لإدارة الأعضاء. deg‏ 
هذا النحو؛ أصبح من المهمٌ للغاية تطوير نهج تحليلي آخر لخدن الأعضاء الجدد ذوي المخاطر 
العالية بشكلٍ سريع ودقيق للإدارة الإكلينيكية» للحفاظ على صحة هذه المجموعة وخفض التكاليف. 
وقد قام فريق التحليلات الإكلينيكية التابع ل 11111383 بتطوير نموذج التنبؤ بالأعضاء 
الجدد (713153/1) والذي سيُحدّد بسرعة الأفراد المعرّضين للخطرء وسيغيّر قريباً تسجيلهم الجديد 
Humana ge gb‏ بدلاً من الانتظار حتى يصبح تاريخ المطالبة الكافي متاحاً لتجميع الملفات 
الإكلينيكية والتنبؤ بمخاطر الصحة المستقبلية. وقد تمّ تصميمٌ نموذج التنبؤ بالأعضاء الجُدّد 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۷ 


الفصل الأول 


لمواجهة التحَدّيات الفريدة المرتبطة بالأعضاء الجُدُّد. وهو أسلوبٌ جديدٌ استفاد من مجموعات 
البيانات الأوسع نطاقاً ودمجها بخلاف بيانات المطالبات الطبية» مثل بيانات تقييم المخاطر الصحية 
التي تم الإبلاغ عنها ذاتياً والمؤشرات المبكرة من بيانات الصيدلةء واستخدام أساليب التنقيب في 
البيانات المتقدّمة لاكتشاف النمطء وسجل المستهلك يوميًا في ع88]هة405 [SU Medicare‏ 
إلى أحدث بيانات 11010828 حتى الآن. وقد تمّ نشرٌ النموذج من خلال فريق مُتعدّد الوظائف 
من التحليلات وتقنية المعلومات والعمليات؛ لضمان تكامل التشغيل وتكامل الأعمال بسلاسة. 

ومنذ أن تم تطبيق نموذج التنبؤ بالأعضاء الجدد في يناير 01؟ فقد استطاعوا بشكلٍ سريع تحديد 
الأعضاء ذوي المخاطر العالية من أجل تسجيلهم في برامج تعليمية إكلينيكية. وقد تمّ إبراز النتائج 
الإيجابية التي تحققت من خلال هذا النموذج في العديد من اتصالات القيادات العليا من 112878ا11. 
às‏ الربع الأول من عام ۳ أعلن Bruce Broussard‏ الرئيس التنفيذي )5 4$ «Humana‏ عن 
”الزيادة التي طرأت على الأعضاء الجدد والتحسّن في عمليات التقيي م الإكلينيكي“ والتي أدّت إلى 
تسجيل ٠٠٠٠١‏ عضو جديد في البرامج الإكلينيكية:» مقارنة ب 60٠١‏ عضو في نفس البرنامج عن فترة 
سابقة من العام بزيادة قدرها 1۷0. بالإضافة إلى زيادة حجم التسجيل في البرنامج الإكلينيي؛ 
أظهرت دراسات النتائج أن المستهلكين الجُدُّد المسجَّلين الذين حَذَّدهم نموذج التنبؤ بالأعضاء الجدد 
قد تم تحويلهم إلى البرامج الإكلينيكية في وقت أقرب» مع أكثر من X0*‏ من الحالات المحؤّلة التي تم 
تحديدها خلال الأشهر الثلاثة الأولى بعد التسجيل الجديد في Medicare Advantage‏ وقد شارك 
المستهلكون الذين تمّ تحديدهم أيضاً معدل أعلى واستمروا لفترة أطول في البرامج. 

توضّح هذه الأمثلة كيفية قيام المنظمة باستكشاف تطبيقات التحليل وتطبيقها لتحقيق أهدافها الإستراتيجية. 
وسنعرض في الفصول القادمة من هذا الكتاب العديد من الأمثلة الأخرى لتطبيقات الرعاية الصحية. 
تحليلات سلسلة قيمة البيع بالتجزتة: 

يُعَذّ قطاع البيع بالتجزثة؛ هو المكان الذي قد ترى فيه معظم تطبيقات التحليلات» وهو مجالٌ 
تكون فيه القيم كبيرةً ولكن هوامش الربح عادةً تكون ضئيلةً وفيه تتغير أذواق العملاء وتفضيلاتهم 
بشكل متكرّر؛ مما يجعل المتاجر - ا مباشرة أو عبر الإنترنت - تواجه العديد من التحَدَّيات في سبيل 
النجاح. وهيمنة السوق في وقتٍ واحدٍ لا تضمن نجاحًا مستمرًا؛ لذا فإنَّ الاستثمار في elsi‏ الكثير 

عن المورّدين والعملاء والموظفين وكلٌ المساهمين الذين يدفعون سلسلة قيمة بيع التجزئة إلى 

النجاح واستخدام تلك المعلومات لاتخاذ قرارات أفضل كان هدفاً لصناعة التحليلات لفترة طويلة. 
وحتى قراء التحليلات العارضين يعرفون استثمارات الهائلة في التحليلات لتقوية سلسلة 
القيمة التابعة لهم. وباممثل؛ استثمرد اکل من ys Ua «£5 Targets Walmart‏ كبار تجار التجزئة 


vy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


ملايين الدولارات في التحليلات الخاصة بسلاسل التوريد الخاصة بهم. ويتمتع معظم مورّدي 
تقنية وخدمة التحليلات بحضور كبيرٍ في تحليلات بيع التجزئةء وتغطية ولو جزء صغير من هذه 
التطبيقات لتحقيق هدف التعيّض الذي نحن بصدد دراسته يمكن أن تملأ كتابًا كاملًا. LiL W‏ 
هذا القسم الضوء فقط على بعض التطبيقات المحتملة. وقد تمّ إجراءٌ معظم هذه العمليات 
بواسطة العديد من تجار التجزئة ويتم توفيرها من خلال العديد من مُورّدي التقنية؛ ولذلك 
ففي هذا القسم سوف نلقي نظرة أكثر عموميةً بدلا من الإشارة إلى حالات مُحدّدة. وتم اقتراح 
هذه النظرة العامة من قبل ط٤۸‏ )عطءنططهء المدير التنفيذي «vCreaTek.com J‏ وهي 5 
لخدمات البرمجيات التحليلية ولديها مكاتبُ في الهند والولايات المتحدة والإمارات العربية المتحدة 
وبلجيكا؛ إذ تقوم الشركة بتطوير تطبيقات في مجالات متعددة. وخصوصًا تحليلات بيع التجزثة. 
ويعرض الشكل )١17-1(‏ المكونات المختارة لسلسلة قيمة بيع التجزئة. يبدأ الشكل با مورّدين 
ويختتم بالعملاء؛ ولكنه يوضّح العديدَ من نقاط قرار التخطيط الإستراتيجي والتشغيلي المتوسط؛ 
إذ يمكن أن sls‏ التحليلات - الوصفية أو التنبؤية أو التوجيهية - دورًا في اتخاذ قراراتِ أفضل 
تعتمد على البيانات. كما يوضح الجدول )١-١(‏ أيضاً بعض المجالات المهمة لتطبيقات التحليلات: 
وأمثلة على الأسئلة الرئيسة التي يمكن أن تجيب عنها التحليلات» وب كل تأكيد. قيمة الأعمال 
المحتملة المشتقة من إجراء مثل هذه التحليلات. ثم يتم مناقشة بعض الأمثلة فيما بعد. 


سلسلة قيمة بين التجزدة 
الإحتياجات الحرجة فى كل نقطة إتصال على سلسلة قيمة بيع التجزئة 





` 
رت س لش ا سس m a cut‏ 


cl‏ اليقاء ورضا العميل ا uc‏ إدارة سلاسل التوريد 
EH xA 2‏ فى لوقت العملاث الترويجية المستهدفة T EAT A,‏ 
E ME cda eene‏ 
خدمة عملاء Id T mu Pes eid ci VA LTV‏ 
ان تكاليف نقل مخفضة i.‏ تين اتيت عر 


























شكل :١-١‏ مثال لتطبيقات التحليلات في سلسلة قيمة بيع التجزئة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vr‏ 





























الفصل الأول 


ال لمخزون 


مرونة 


السعر 


تحليل 


السوق 


رؤية 


المتسوق 





ve 





جدول :1-١‏ أمثلة لتطبيقات التحليلات في سلسلة قيمة بيع التجزئة 


سؤال الأعمال 


-١‏ أي المنتجات عليها طلبٌ أعلى؟ 
*- ما هي المنتجات بطيئة الحركة 
أو المتقادمة؟ 


-١‏ ما مقدار صافي هامش الربح؟ 
۲- ما مقدار الخصم ال ممكن منحه على 
Sez‏ 


-١‏ ماهي المنتجات التي يجب دمجها 
لإنشاء عرض حزمة؟ 

؟- هل يجب الجمع بين المنتجات بناءً 
على خصائص الحركة البطيئة والسريعة 
الحركة؟ 

- هل يجب إنشاء حزمة من نفس الفئة أو 
خط فئة مختلف؟ 





قيمة الأعمال 


-١‏ توقع استهلاك المنتجات سريعة الحركة, 
وطلب مخزونٍ كاف ea ilgis‏ 
سيناريو نفاذ المخزون. 

؟- رفع Jic xà‏ دوران المخزون للمنتجات 
بطيئة الحركة؛ من خلال الجمع بينها في 
طلب مرتفع. 

-١‏ تخفيض السعر لكل منتج يمكن أن يقلل 
خسارة هامش الدولار. 

gi -Y‏ تحديدٌ السعر الأمثل لحزمة المنتجات 
لتوفير هامش الدولار 

-١‏ يُحدّد تحليلٌ التقارب الارتباطات الخفية 
بين المنتجات, والتي يمكن أن تساعد في 
القيم التالية: 

٠‏ وضع إستراتيجية لحزمة المنتج؛ 
استنادًا إلى التركيز على المخزون أو 
الهامش. 

٠‏ زيادة عمليات 055-56[1ت عن 
طريق إنشاء حزمة من فئات 
مختلفة أو زيادة عمليات 1أه5-منا 
من نفس الفئات. 

عن طريق تقسيم العملاء؛ eU, o S‏ 

الأعمال اتات ع و تخخصة ين 

تجربة العملاء. وتؤدي إلى الاحتفاظ بهم. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 























تحول 
العميل إلى 
المنافسين 


الفروع 
الجديدة 








نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


سؤال الأعمال 


-١‏ مَنْ هم العملاء الذين لن يعودوا؟ 

- ما مقدار الخسارة في الأعمال؟ 

-٠"‏ كيف يكن الاحتفاظ بهم؟ 

ع- ما التركيبة السكانية للعميل صاحب 
الولاء؟ 


-١‏ ماهي قناة اكتساب العملاء ذات 
التكلفة الأقل؟ 

-Y‏ ما هي قناة الاحتفاظ الأفضل بالعملاء؟ 

-٠‏ ما هي القناة الأكثر ربحية؟ 


-١‏ ما هو ال موقع الواجب اختياره؟ 
-٠‏ ما هو المخزون الافتتاحي الواجب اقتناؤه 


وما مقدازة؟ 


-١‏ كيف يجبُ تخطيط المتجر؛ من أجل 
الخطوط العليا الأفضل؟ 

۲- كيف هكن زيادة تجربة العملاء داخل 
المتجر؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





قيمة الأعمال 


-١‏ يمكن تحديدٌُ العلاقات بين العملاء 
وا منتجات التي تؤدي لتحؤل العملاء. 
وبالتالي يمكن أن يتم التركير بشكلٍ 
أفضل على جودة المنتج والسبب وراء 
هذا التحول. 

- بالاعتماد على قيمة حياة العميل 
(1:17)؛ يمكن القيامٌ بالتسويق af gll‏ 
مما يؤدي إلى الاحتفاظ بالعميل. 

يمكن تحسينُ ميزانية التسويق بناءً على 

رؤية العائد الأفضل على الاستثمار. 


-١‏ يمكن استخدامٌ أفضل الممارسات للمواقع 
والقنوات الأخرى للبدء في القفز. 

- يمكن أن تساعد المقارنة ببيانات المنافس 
في إنشاء عامل تمييز/ 1758 لجذب 
العملاء الجدد. 


otis فهم ارتباط المنتجات لاتخاذ قرارٍ‎ -١ 
تصميم المتجر وتوافقه بشكلٍ أفضل مع‎ 
احتياجات العملاء.‎ 

ل- يمكن تخطيطٌ نشر القوى العاملة لتفاعل 
العملاء بشكلٍ أفضل وبالتالي إرضاء 
تجربة العملاء. 


vo 























الفصل الأول 


سؤال الأعمال قيمة الأعمال 


-١‏ ما التركيبة السُكانية التي تدخل المتجر | -١‏ يمكن تخطيطٌ العروض الترويجية 
خلال فترة ذروة المبيعات؟ والأحداث داخل المتجر بناءً على التركيبة 

تحليلات -١|‏ كيف يمكن تحديدٌُ العميل صاحب| السكانية للزيارات الواردة. 

ws (LTV) Lei | gaal‏ مدخل المتجر؛ بحيث | -١‏ مشاركة العميل المُستَهدّف والخصم 

يمكن توفير تجربة شخصية أفضل لهذا | الفوري يُعرّزان تجربة العميل؛ مما يؤدي 

العميل؟ إلى زيادة الاحتفاظ به. 











عادةً ما يعرف موقع بيع التجزئة عبر الإنترنت عملاءه بمجرد تسجيل دخول العميلء وبالتالي 
يمكنهم تقديم صفحات/ عروض مُخصّصة لتحسين التجربة. وبالنسبة لأيّ متجر لبيع التجزثة؛ 
فإنَّ معرفة عميله عند مدخل المتجر لا يزال يمثل تحديًّا كبيرًا. ومن خلال الجمع بين تحليلات 
الفيديو والمعلومات/ الشّارات الصادرة من خلال برنامج الولاء» قد يتمكّن المتجرٌ من تحديد 
العميل عند المدخل نفسه. وبالتالي تمكين boeg up-sell gf cross-sell ollas) islo! ño,‏ 
على ذلك؛ يمكن توفير تجربة تسوق شخصية بمشاركة أكثر تخصيصاً خلال وقت العميل في المتجر. 

ويستثمر تجارٌ التجزئة الكثيرَ من امال في نوافذ عرض جذَابة أو فعاليات ترويجية أو 
رسومات مُخصّصة أو تزيين المتجر أو إعلانات مطبوعة أو لافتات. ولتعزيز فعالية هذه الأساليب 
التسويقية؛ يمكن للفريق استخدامٌ تحليلات المتسوقين من خلال مراقبة صور الدوائر التلفزيونية 
المغلقة (00:137) لمعرفة التفاصيل الدهوغرافية لحركة القدم داخل المتجرء ويمكن تحليلٌ صور 
7 باستخدام خوارزميات مُتقدّمة لاستخراج تفاصيل دهوغرافيةء مثل: السّن والجنس» 
ومزاج الشخص الذي يتجول بالمتجر. 

إضافة إلى ذلك؛ يكن لبيانات حركة العميل داخل ال متجر عند دمجها مع تصميم الرفوف أن تعطي 
نظرةً ثاقبةً مدير ا متجر لتحديد مناطق البيع السّاخنة/ ا مربحة داخل المتجر. وعلاوةً على ذلك؛ يمكن 
مدير المتجر استخدامٌ هذه المعلومات لتخطيط توزيع القوة العاملة لهذه المناطق في أثناء فترات الذروة. 

Baix al eo ls Gales‏ تحليل سلة السوق من قبل مديري الأقسام لدفع بيع 512105 بطيئة 
الحركة. وباستخدام التحليلات المتقدّمة من البيانات المتاحة؛ يمكن أن يكون تقاربُ المنتج في 
dol‏ مستوى من 51617 لدفع عائدات الاستثمار على عروض الحزمة لأعلى. وبالإضافة إلى ذلك؟ 


vi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 














نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


فباستخدام أساليب مرونة السعر؛ يمكن أيضاً تخفيصٌ السعر لعرض الباقة؛ مما يقلل أيّ خسارة 
في هامش الربح. 

وهكذاء وباستخدام بيانات التحليلات؛ لا يممكن لتجار التجزئة الحصول على معلومات عن 
عملياتهم الحالية فحسب؛ بل يمكن أيضاً الحصولٌ على مزيد من الإحصاءات لزيادة الإيرادات 
وخفض التكلفة التشغيلية لربح أعلى. ويقترح مدوّن في علوم البيانات المركزية (ع©6معك5 10864 
J) llà EB (Central‏ $5 ما لتطبيقات تحليلات التجزئة الحالية والمحتملة؛ والتي يمكن لمتاجر 
التجزئة الكبرى مثل 4778202 استخدامها. وهذه القائمة متاحةٌ على: 
http://www.datasciencecentral.com/profiles/blogs/20-data-science-systems-used-by-‏ 

ainazon-to-operate-its-business. 


ips oasdl sls 5B TL 6,53 Ss‏ الأمثلة على هذه الفرص امُدرّجة هنا؛ ولكنك سترى 
العديدٌ من الأمثلة على مثل هذه التطبيقات في جميع أنحاء الكتاب. 


أسئلة مراجعة على القسم :5-١‏ 

-١‏ اذا تستثمرٌ شركة التأمين الصحي في التحليلات عقب اكتشاف الاحتيال؟ ولماذا من مصلحتهم 
التنبؤ باحتمالية سقوط المرضى؟ 

۲- ما هي التطبيقات الأخرى المشابهة للتنبؤ بالسقوط التي يمكنك تصورها؟ 

S(Humana ١ كيف تقنع عميل تأمين صحي جديداً بتبَنّي أأماط حياة صحية (مثال‎ -٠ 

4- خَدّد على الأقل ثلاث فرص أخرى لتطبيق التحليلات في سلسلة قيمة البيع بالتجزئة بخلاف 
تلك التي تمَّ تغطيتها في هذا القسم. 

ه- ما هي متاجرٌ بيع التجزئة التي تعرفها التي تستخدمٌ بعض تطبيقات التحليلات: التي 
تمّ تحديدّها في هذا القسم؟ 

۷-١‏ مقدمة موجزة لتحليلات البيانات الضخمة: 


ما هي البياناث الضخمة؟ 
(sl‏ كتاب عن التحليلات وعلم البيانات؛ يجب أن يشمل تغطيةً كبيرةً لها يُسمّى بتحليلات 
البيانات الضخمة. وسنقوم بتغطيتها في الفصل السابع؛ ولكننا هنا نعرض مقدمةً موجزةً للغاية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري w‏ 


الفصل الأول 


عن بداية ظهورها. إِنَّ عقولنا تعمل بسرعة وفعالية عالية ومتنوعة في معالجة كمياتٍ كبيرة من 
جميع أنواع البيانات: الصورء والنصوص, والأصوات. والروائح» ومقاطع الفيديو. حيث تقوم 
معالجة جميع أشكال البيانات المختلفة بسهولة نسبية. غير أنَّ أجهزة الحاسوب Š JIS Y‏ 
صعوبةً في مواكبة وتيرة إنشاء البيانات فضلاً عن تحليلها بسرعة» وهذا هو السبب في أن لدينا 
مشكلة البيانات الضخمة. bo f3)‏ البياناتُ الضخمة؟ ببساطة البيانات الضخمة؛ هي البيانات التي 
لا يمكن تخزينها في وحدة تخزين واحدة. وتشير البياناتٌ الضخمة عادةً إلى البيانات التي تأني في 
العديد من الأشكل المختلفة: مهيكلةً وغير مهيكلة: في تيار: وما إلى ذلك. إن المصادر الرئيسة 
مثل هذه البيانات هي مقتطفات من مواقع الويب» والمنشورات بمواقع التواصل الاجتماعي Jis‏ 
Facebook‏ وبيانات من الزيارات أو من أجهزة الاستشعار أو الطقس. Gi glaug‏ محرك بحث 
على الويب» مثل dI Google‏ بحث وفهرسة المليارات من صفحات الويب للنحك نتائج بحث 
ملائمة في جزءٍ من الثانية. وعلى الرغم من أن هذا لا يتم بشكلٍ لحظي؛ فإِنَّ إنشاء فهرس لجميع 
ضفحات الويب على الإنترنت ليس مهمة سهلة. Giby‏ الحظ؛ فقد نغمكتت شركة ولوة0©» من 
حل هذه المشكلة. فمن بين الأدوات الأخرىء استخدمت أساليب تحليل البيانات الضخمة. 

وهناك جانبان لإدارة البيانات بهذا الحجم وهما: التخزين واممعالجة. فإذا استطعنا شراء 
حل تخزين مُكلّف للغاية لتخزين كلّ هذا في مكان واحد على وحدة واحدة؛ فإنَّ جعل هذه 
الوحدة تسمح بالخطأ قد يكون مكلفاً للغاية. ومن ثم فقد تمّ اقتراح do‏ عبقريّ يشتملٌ على 
تخزين هذه البيانات في أجزاء مختلفة من أجهزة متصلة بشبكة: ووّضع نسحخة أو اثنتين من 
هذه البيانات في مواقع مختلفة على الشبكة: من الناحيتين المنطقية والمادية. وتم استخدامه في 
IIIT ud OS gila) Google $ LI‏ بنظام ملفات ©6008[1): وتمّ تطويره وإصداره لاحقاً 
كمشروع 42316 باسم نظام الملفات المقسمة من (111075 م112000). 

ومع ذلك؛ فإن تخزين هذه البيانات يمثل نصف المشكلة فقط. فالبيانات لا قيمة لها إذا كانت 
fad piis Y‏ للأعمال. ولكي توفر قيمةً للأعمال؛ فلا بد من تحليلها. ولكن كيف يمكن تحليلٌ 
هذا القدر الهائل من البيانات؟ حيث لا يمكن تمريرٌ كافة الحسابات إلى جهاز حاسوب واحد. 
فهذا من شأنه إنشاءٌ قدر من أحمال البيانات على هذا الجهاز. وقد تمّ اقتراحٌ حل عبقريٌ آخر. 
وهو دقع الحوسبة إلى البيانات, بدلاً من دفع البيانات إلى عقدة الحوسبة. وقد كان هذا نموذجًا 
جديدًا وأسفر عن طريقة جديدة تمامًا لمعالجة البيانات وهذا ما نعرفه اليوم باسم نموذج برمجة 
.MapReduce‏ الذي جعل معالجة البيانات الضخمة حقيقة. وقد تم MapReduce 5gh5‏ $ 
الأصل $ -Google‏ وظهر إصدارٌ لاحق من قبل -Hadoop MapReduce „us Apache g s ja‏ 


V^‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


واليومَ عندما نتحدثٌ عن التخزين أو المعالجة أو تحليل البيانات الضخمة؛ فإننا نذكر HDFS‏ 
وع160116م218 عند مستوى معينء وقد تمَّ اقتراحُ معايير وبرامج أخرى ذات صلة. وعلى الرغم من 
أن مجموعة الأدوات الرئيسة متاحة با مجان؛ فقد تم إطلاق العديد من الشركات لتقديم التدريب 
أو الخدمات المتخصصة في هذا اhجاJ. -Teradata Asters Clouderag Horton Works Ja‏ 


وعلى مدى السنوات القليلة الماضية حدث مزيدٌ من التغير؛ فما كان يُسِمَّى البيانات الضخمة 
أصبح الآن تطبيقات البيانات الضخمة. وقد أضافت الحاجةٌ إلى معالجة البيانات القادمة سرعةً 
إلى المعادلة. ومن الأمثلة على معالجة البيانات السريعة؛ التداول الخوارزمي. والذي يستخدم 
المنصات الإلكترونية القائمة على خوارزميات تداول الأسهم في السوق المالية» والتي تعمل في 
غضون الميكروثانية. ومن الأمثلة الأخرى على المجموعة الواسعة من البيانات؛ هو تحليل المشاعرء 
والذي يستخدم أشكالاً مختلفةً من البيانات من منصات وسائل التواصل الاجتماعي واستجابات 
العملاء لقياس المشاعر. واليوة» ترتبط البيانات الضخمة بأيّ نوع من البيانات الكبيرة التي 
تتميرٌ بخصائص الحجم والسرعة والتنوع. وتوضح الحالة العملية 1-١‏ تطبيق تحليلات البيانات 
الضخمة في صناعة الطاقة. وسوف ندرس تقنيات وتطبيقات البيانات الضخمة في الفصل السابع. 


أسئلة مراجعة على القسم ١-ا:‏ 

-١‏ ما هي تحليلاث البيانات الضخمة؟ 

؟- ما هي مصادرٌ البيانات الضخمة؟ 

“- ما هي خصائصٌ البيانات الضخمة؟ 

-٤‏ ما هي المعالجةٌ الفنية التي يتم تطبيقها لمعالجة البيانات الضخمة؟ 


(1) http://www.cdc.gov/homeandrecreationalsafety/falls/adultfalls.html. 
(2) Gill, T. M., Murphy, T. E., Gahbauer, E. A., et al. (2013). Association of injurious falls with disability 


outcomes and nursing home admissions in community living older persons. American Journal of. 
Epidemiology, 178(3), 418-425. 


(3) Gates, S., Smith, L. A., Fisher, J. D., et al. (2008). Systematic review of accuracy of screening instruments 
for predicting fall risk among independently living older adults. Journal of Rehabilitation Research 
and Development, 45(8), 1105-1116. 


Contributors: Harpreet Singh, PhD; Vipin Gopal, PhD; Philip Painter, MD. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري va‏ 


الفصل الأول 


حالة عملية 5-١‏ 

LU Center Point 4$‏ تستخدم التحليلات الفورية للبيانات الضخمة؛ لتحسين خدمة العملاء 

Point åS i5‏ 06306 للطاقة إحدى الشركات الكبرى لتوصيل الطاقة ويقع مقرّها في 
هيوستونء تكساس. وتشمل أعمالها الأساسية نقل وتوزيع الكهرباء» وتوزيع الغاز الطبيعي» 
ومبيعات وخدمات الغاز الطبيعي. ولديها أكثرُ من خمسة ملايين عميل في الولايات المتحدة. 

وتستخدم الشركة شبكات الطاقة الذكية؛ لجمع المعلومات الفورية عن صحة 
الجوانب المختلفة للشبكة: مثل: العدادات والمحولات والمفاتيح الممُستَخدّمة في توفير 
الكهرباء. ويتم تحليلٌ هذه المعلومات بشكلٍ فوري باستخدام الطاقة مع تحليلات 
البيانات الضخمة؛ مما يتيخ تشخيصًا دقيقًا وأسرع بكثير. فعلى سبيل المثال: يمكن أن 
تتنباً وتساعد في منع انقطاع التيار الكهرباي. 

إضافةً إلى ذلك؛ تقوم الشركة بجمع بيانات الطقس؛ مما يسمح بأن تساعد البيانات 
التاريخية في التنبؤ بانقطاع التيار نتيجةً للعاصفة. وتعمل هذه الرؤية كدليلٍ إرشادي 
لوضع الموارد الصحيحة قبل العاصفة؛ لتجنب حدوث الانقطاع. 

ثانيةً ومن أجل أن تفهم عملاءها على نحو أفضل: تستخدم 56أه7 +0616 تحليل 
المشاعر الذي يفحص رأي العميل عن طريق العاطفة (السعادة والغضب والحزنء وما 
إلى ذلك)» وتقوم الشركة بتصنيف عملائها بناءً على مشاعرهم ومن ثمّ تكون قادرةً على 
البيع لعملائها بطريقة تستند إلى شخصياتهم وتقدم تجارب أكثر قيمة للعملاء. 

ونتيجة لاستخدام تحليلات البيانات الضخمة» وفرت الشركة ٠٠٠,٠٠١‏ جالون من 
الوقود ف العامين امماضيين؛ من خلال حل ستة ملايين طلب خدمة عن يُعْد. بالإضافة 
إلى ذلك وفرت الشركة galo YE‏ دولار لعملائها في هذه العملية. 

أسئلة للمناقشة: 

-١‏ كيف تُمكن لشركات الكهرباء التنبؤ بانقطاع ممكن في موقع؟ 

ماهو تخليل مشاعر العفيل؟ 

àS -Y‏ يساعدٌ تحليلٌ مشاعر العملاء الشركات على تقديم خدمة مُخصّصة لعملائها؟ 


^ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


ما الذي هكننا تعلمه من هذه الحالة العملية: 
1 

باستخدام تحليلات البيانات الضخمة؛ يمكن لشركات الطاقة jo‏ مشكلات العملاء بشكل 
أفضل مثل انقطاع التيار والأعطال الكهربائية في غضون فترة زمنية أقصر مقارنةً بالعمليات 
السابقة. كما يمكن أن يساعد تحليلٌ المشاعر في استهداف عملائهم وفقاً لاحتياجاتهم. 
Sources: Sap.com, "A 'Smart' Approach to Big Data in the Energy Industry; http://www.‏ 
sap.com/bin/sapcom/cs cz/downloadasset.201310--oct-0920-.a-smart-approach-to-‏ 
big-data-in-the-energyindustry-pdf.html (accessed June 2016); centerpointenergy.‏ 
com, "Electric Transmission & Distribution (T&D);" http://www.centerpointenergy.‏ 
com/en-us/Corp/Pages/Company-overview.aspx (accessed June 2016); YouTube.com,‏ 


"CenterPoint Energy Talks Real Time big Data Analytics," https://www.youtube.com/ 
watch?v-s7CzeSIIEfI (accessed June 2016). 


8-١‏ نظرة عامة على النظام البيئي للتحليلات: 

أنت الآن عزيزي القارئ وبناءً على ما تقدّم؛ مُتحمّسٌ لإمكانات التحليلات وتريد الانضمام 
إلى هذه الصناعة المتنامية. ولكن مَنْ هم اللاعبون الحاليون وماذا يفعلون؟ وما المكان الذي 
يناسبك؟ إِنَّ اليدق من هذا القسم هو تحديدٌ قطاعات مختلفة من صناعة التحليلات» وتقديم 
تصنيف للأنواع المختلفة من المشاركين في الصناعة. وتوضيح أنواع الفرص المتاحة لمحترفي 
التحليلات. لقد تَمّ تحديدٌ أحد عشر نوعًا مختلقًا من اللاعبين في النظام البيئي للتحليلات. كما 
أنَّ فهم النظام البيئي يعطي القارئ رؤيةً أوسع لكيفية تلاقي اللاعبين المختلفين. وهناك غرضش 
ثانوي لفهم النظام البيئي للتحليلات. الخاص بمتخصّصي ذكاء الأعمال أيضاً وهو أن يكون على 
ole‏ بالشركات والعروض والفرص الجديدة في القطاعات المتحالفة مع التحليلات. ويُختتم القسم 
ببعض الملاحظات عن القرص المتاحة للمحترفين للتحدك عبر هذه المجموغات. 

وعلى الرَّغم من أن بعض الباحثين قد ميّزوا بين مُتخصّصي تحليل الأعمال وعلماء البيانات 
«(Patil 20129 Davenport)‏ كما أشرنا سابقاً بهدف فهم النظام البيئي الشامل للتحليلات؛ 
فإننا نعاملهم كمهنة واحدة واسعة. ومن الواضح أن احتياجات المهارات قد تختلف بين أخصاني 
رياضيات قوي إلى مبرمج إلى مصمم نماذج إلى أخصائي اتصالات» ونعتقد أنَّ هذه المسألة قد 
تم حلّها على مستوى أصغر/ فردي بدلاً من المستوى الكلي لفهم مجموع الفرص. كما نتبنّى 
تعريفًا واسعًا للتحليلات ليشمل جميع الأنواع الثلاثة وفقاً ل 121801315 وهي الوصفية/ إعداد 
التقارير/ التصويرات» والتنبؤية والتوجيهية كما هو ÁL gó‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري M‏ 


الفصل الأول 


ويُوضّح الشكلٌ ٠١-١‏ وجهة نظر واحدة للنظام البيتي للتحليل. إذ تتمثلٌ مكونات النظام 
البيني في بتلات زهرة التحليلات. وقد تمَّ تحديدٌ أحد عشر قطاعًا أو قسمًا رئيس ا في مجال 
التحليلات. ويتمّ تجميع مكونات النظام البيئي التحليلي في ثلاث فئات تمثلها البتلات الداخلية, 
والبتلات الخارجيةء وبذرة (الجزء الأوسط من) الزهرة. 

ويمكن أن يُطلّق على البتلات الستة الخارجية موردو التقنية. وتأتي إيراداتهم من تقديم 
التقنية» والحلولء والتدريب لمنظمات مستخدمي التحليلات؛ حتى يتمكّنوا من توظيف هذه 
التقنيات بأكثر الطرق فعاليةَ وكفاءةً. ويمكن تعريف البتلة الداخلية بصفة عامة كمسرعات 
التحليلات. وتعمل أجهزةٌ التسريع مع مورّدي التقنية وا مستخدمين. وأخيرًا؛ يشتمل جوهر النظام 
البيني على منظمات مستخدمي التحليلات. وهذا هو العنصر الأكثر أهمية؛ إذ يتم دفع كل 
مجموعة من مجموعات صناعة التحليلات من قبل منظمات ال مستخدمين. 





شكل :18-١‏ النظام البيني للتحليلات 


ÓI‏ استعارة اسم «زهرة» مناسبٌ تمامًا للنظام البيئي للتحليلات؛ إذ يتداخل العديدٌ من الأشخاص 
بعضهم مع بعض. على غرار كائن حي مثل الزهرة. حيث تنمو كل هذه البتلات وتذوب Tea‏ 
ونحن نستخدمٌ مصطلحات المكونات والمجموعات والبتلات والقطاعات بشكل متبادل لوصف 
اللاعبين المختلفين في مجال التحليلات. وسنقدّم فيما يلي كلاً من القطاعات الصناعية كما سنقدّم 
بعض الأمثلة للاعبين في كل قطاع. إن قائمة أسماء الشركات المُدرّجة في أيّ بتلة ليست شاملة. 
فقائمة الممثلين للشركات في كلّ مجموعة تهدف فقط إلى توضيح العرض الفريد للمجموعة لوصف 
AY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


المواهب التي يمكن استخدامها أو توظيفها. وكذلك؛ فإن ذكر اسم الشركة أو قدرتها في مجموعة 
مُحدّدة لا يعنى أنها النشاط / العرض الوحيد لتلك المنظمة. والهدف الرئيس؛ هو التركيرُ على 
القدرات التحليلية المختلفة داخل JS‏ عنصر من عناصر حيّر التحليلات. وتعمل العديدٌ من الشركات 
في قطاعات متعددة داخل صناعة التحليلات: وبالتالي توفر فرضًا للحركة داخل المجال أفقيًا ورأسيًاء 

ولقد قام مات تراك كنا ا818) - وهو شريك برأس المال مع فرست مارك 
(FirstMark)‏ - بتطوير نظام بيئي للتحليلات يُركّزْ على البيانات الضخمة: ويهدف 
إلى تتبع اللاعبين الجدد والقدامى في مختلف قطاعات صناعة البيانات الضخمة. Jis‏ 
صورة مرئية جميلة من تفسيره للنظام البيئي وقائمة شاملة من الشركات على موقعه: 
http://mattturck.com/2016/02/01/Big-data-landscape/(accessed ^ August 2016)‏ 
وسنرى أيضاً نظامًا بيئيًا مشابمًا في سياق إنترنت الأشياء (1017) في الفصل الأخير. 
مُورّدو البنية التحتية لتوليد البيانات: 

قد يكون من الأولى أن نبدأ بالتعرّف على هذه المجموعات من خلال ملاحظة مجموعة 
جديدة من الشركات التي تمكّن من توليد وجمع البيانات التي يمكن استخدامها لتطوير رؤى 
تحليلية. وعلى الرغم من أنَّ هذه المجموعة يمكن أن تشمل جميع النقاط التقليدية من أنظمة 
البيع؛ وأنظمة إدارة ا مخزونء patiks‏ التقنية لكلّ خطوة في سلسلة عمليات/ قيمة الشركة 
سننظر أسامًا في اللاعبين الجدد حيث كان التركيرٌ الأماسي على تمكين المنظمة من تطوير رؤى 
جديدة لعملياتها بدلا من تشغيل عملياتها الأماسية. وبالتالي تشمل هذه المجموعة شركات 
إنشاء بنية تحتية لجمع البيانات من مصادر مختلفة. 

ومن المكونات الناشئة لمثل هذه البنية التحتية هو جهاز الاستشعار. حيث تقوم أجهزة 
الاستشعار بجمع كمية هائلة من البيانات معدل أسرع» وقد 5& اعتمادها من قبل قطاعات 
مختلفةء مثل: الرعاية الصحيةء والرياضةء والطاقة. على سبيل المثالء البيانات الصحية التي 
تجمعها تستخدم أجهزة الاستشعار بشكلٍ عام لتتبّع الحالة الصحية للمستخدمين. وبعض أجهزة 
الاستشعار الرئيسة التي تقوم بجمع المعلومات الصحية هي 001 "كناف وعاع6008): Shimmer‏ 
و]4ثأطال5. وبالمثل؛ فإنَّ صناعة الرياضة تستخدم أجهزة استشعار لجمع البيانات من اللاعبين 
والميدان لتطوير الإستراتيجيات وتحسين اللعب الجماعي. ومن أمثلة الشركات التي تنتجٌ أجهزة 
الاستشعار ذات الصّلة Shockboxs .Zepps Sports Sensors åk JL‏ وغيرها. كما eX‏ 
أجهزة الاستشعار لإدارة الزيارات. ويساعد ذلك في اتخاذ إجراءات فورية للتحكّم في الزيارات, 
ومن مو ردي „Sensys Networks .Garmins .Advantech B&-B SmartWorx às42Jl ea‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري AY‏ 





الفصل الأول 


وتلعبُ أجهزة الاستشعار دورًا B Ud;‏ إنترنت Ico is el AI‏ أساسيًا من الكائنات الذكية. 
وهي تجعلٌ الاتصال بين آلةِ وأخرى ممكنًا. والجهات الفاعلة الرئيسة في البنية التحتية لإنترنت الأشياء؛ 
هي إنتل (15161) ومايكروسوفت (Google) Jz525 (Microsoft)‏ وآي بي إن (181/1). وسيسكو 
lecasls (SIKO Products) 4:555,» s$4 45 (Smartbin) 33 cb as (Cisco)‏ إنجنيرنج 
(Apple) Js (Omega Engineering)‏ وإس إیه بي (SAP)‏ وربما تكون هذه هي ال مجموعة 
الأكثر تقنيةً في النظام البيئي. وسوف نستعرضصٌ النظام البيئي لإنترنت الأشياء '101 في الفصل الثامن. 
وفي الواقع؛ يُوجَد تقرييًا نظام بيني عن كلّ مجموعة من المجموعات التي تُحدّدها هنا. 


مُورّدو البنية التحتية لإدارة البيانات: 


تضم هذه المجموعة جميعَ المنظمات الرئيسة التي توفر الأجهزة والبرامج التي تفسّر الأساس 
الجوهري لجميع حلول إدارة البيانات. ومن الأمثلة الواضحة على ذلك كبار الجهات التي توفر 
البنية التحتية لحوسبة قواعد البيانات» مثل: 1811 و1011 «AUS JI a5 .Oracles HP g‏ 323523 
حلول التخزين: EMC Jès‏ (والتي اشترتها 1611 مؤخرًا) وم6۲4 والشركات التي pi‏ منضّات 
الأجهزة والبرمجيات المحلية مثل 18141 و053616 وتيراداتاء ومورّدو حلول البيانات الذين يقدَّمون 
أنظمةً مستقلةً لإدارة قواعد البيانات للأجهزة والبرامج» مثل عائلة ,501.561 من مايكروسوفت 
(2160501): ويندرجٌ تحت هذه المجموعة أيضاً مورّدو البرامج المتكاملة المتخصّصة مثل 547. 
كما تشتملٌ هذه المجموعة على منظمات أخرى. مثل مورّدي أجهزة قواعد البيانات ومقدَّمي 
الخدمات والدامجين والمطورين وغيرهم: ممَّن يدعمون النظم البيئية لهذه الشركات. 

وتظهر العديدٌ من الشركات الأخرى باعتبارها لاعبين أساسيين في مجالات ذات صلة: وذلك 
بفضل البنية التحتية للشبكة التي تمكّن الحوسبة السحابية. وقد اشتهرت شركات مثل (خدمات 
.IBM (Bluemix)s (Amazon ġj— og!‏ وesforce.com‏ بتقدیم حلول مستودعات 
البيانات والتحليلات الكاملة عبر السّحابة» والتي تمَّ الآن اعتمادها من الشركات المذكورة. 

وهناك مجموعةٌ حديثةٌ من الشركات في مجال البيانات الضخمة تُعَذَّ هي كذلك جزءًا من 
هذه ال مجموعة. ولا تقوم شركاتٌ مثل 010010688 I 555: 8)5 Jb, Hortonworkss‏ 8542 
الخاصة بهم؛ ولكنهم يقدّمون خدمات البنية التحتية والتدريب؛ لإنشاء منصة البيانات الضخمة. 
وهذا Flumes .Kafkas .Sparks .NoSQL s .MapReduces .-Hadoop vL e az (Ja 2o‏ 
وغيرها من التقنيات المرتبطة بالتحليلات. وبالتالي؛ يمكن أيضاً تجميعهم تحت إشراف استشاريين 
أو مدربين لتمكين البنية التحتية. إِنَّ النظم البيئية الكاملة للاستشاريين وتكامل البرمجيات» 
ومُقدّمي التدريب وغيرهم من مُقدِّمي خدمات القيمة المضافة قد أفادت العديد من اللاعبين 


^E‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


الكبار في مجموعة البنية التحتية لإدارة البيانات. وتعمل بعضٌ المجموعات المذكورة أدناه على 
تحديد هؤلاء اللاعبين؛ لأن العديد منهم ينتقلٌ إلى التحليلات؛ إذ إِنَّ الصناعة تحول تركيزها من 
معالجة المعاملات بكفاءة إلى اشتقاق القيمة التحليلية من البيانات. 
مُورّدو مستودعات البيانات: 

توفّر الشركات التي تركز على مستودعات البيانات التقنية والخدمات التي تهدف إلى دمج 
البيانات من مصادر متعددة. وبالتالي تمكينٌ المنظمات من استخلاص وتقديم قيمة من أصول 
البيانات الخاصة بها. وتوفر العديد من الشركات في هذا المجال الأجهزة الخاصة بهم لتوفير 
مستودعات البيانات بكفاءة واسترجاعها ومعالجتها. LŽ‏ شركاتٌ مثل 181/1 و0226 و 
8 من اللاعبين الأساسيين في هذا المجال. وتشملُ التطورات الأخيرة في هذا المجال أداء 
التحليلات على البيانات مباشرةً في الذاكرة. وهناك قطاع نمو كبير آخر هو مستودع البيانات في 
السّحابة ومن أمثلة هذه الشركات 52019181 و864[111. وتعمل الشركات في هذه ا مجموعة 
بوضوح مع جميع الجهات الأخرى في القطاع؛ من أجل توفير حلول وخدمات مستودع البيانات 
ضمن نظامها البيئي وبالتالي تصبح العمود الفقري لصناعة التحليلات. لقد كانت صناعةً رئيسةً 
في حَدَّ ذاتهاء وبالتالي» مورّد ومستهلك للمواهب التحليلية. 


مُورّدو البرمجيات الوسيطة: 


بدأ مستودعٌ البيانات بالتركيز على جلب جميع مخازن البيانات إلى منصة على مستوى 
المؤسسة. وأصبح إنشاءٌ مغزى لهذه البيانات صناعةً في حَدٌ ذاتها. ويتمثل ugl‏ العام لقطاع 
البرمجيات الوسيطة في توفير أدوات سهلة الاستخدام للتقارير أو التحليلات الوصفية» Kis ilg‏ 
جزءًا أساسيًا من ذكاء الأعمال أو التحليلات المستخدّمة في المنظمات. ومن أمثلة الشركات في هذا 
ا مجال سا٥‏ »عه Micros‏ وغيرها الكثير. وقد تَمّ الاستحواذً على عدد قليلٍ من كبار اللاعبين 
الذين كانوا وسطاء مستقلين من قبل الشركات في أول مجموعتين. فعلى سبيل اللمثال» أصبحت 
3 جزءًا من أوراكل واستحوذت 547 على Business Objects‏ واستحوذت de IBM‏ 
85 وقد كان هذا القطاعٌ مرادقًا لمورّدي ذكاء الأعمال الذين يقدمون إلى الصناعة خدمات 
لوحة ال معلومات والتقارير والتصوير؛ بناءً على بيانات معالجة المعاملات وقاعدة البيانات ومورّدي 
مستودعات البيانات. وهكذا انتقلت العديدٌ من الشركات إلى هذا المجال على مرّ السنين: Le‏ 
في ذلك مُورّدو برامج التحليلات العامة مثل 545 أو مُقدِّمو خدمات مرئية جديدة مثل تابلوه 
(Tableau)‏ أو العديد من مُقدَّمِي التطبيقات المتخصّصة. ويورد سجل المنتجات في .۲5۷۷1 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ^o‏ 


الفصل الأول 


٥۲8 1‏ موردًا فققط في هذه الفئة؛ وذلك اعتبارًا من يونيو 15٠١7!؛‏ لذلك كان القطاع قويًا. 
Q—59  «(http://www.tdwidirectory.cona/category/business-intelligence-services)‏ 
الواضح أنَّ هذا هو القطاع الذي يحاول الانتقال إلى قطاع علم البيانات في الصناعة. 
مُورّدو خدمة البيانات: 

يتم توليدٌ الكثير من البيانات التي تستخدمها المنظمة للتحليلات داخليًا من خلال عملياتها. 
ولكن هناك العديدٌ من مصادر البيانات الخارجية التي تلعب دورًا رئيسًا في اتخاذ القرار با منظمات. 
وتشمل أمثلة مصادر البيانات هذه بيانات التركيبة السكانية» وبيانات الطقسء والبيانات التي تم 
جمعها من قبل أطراف ثالثة» والتي يمكن أن تمد المنظمة بمعلوماتٍ مفيدة في صنع القرارء وما 
إلى ذلك. وقد انتهز العديدٌ من الشركات الفرصة لتطوير آليات جمع وتكامل وتوزيع البيانات 
المتخصّصة. وترمّز هذه الشركات عادةً على قطاع صناعي مُحدَّد وتستندٌ إلى علاقاتها القائمة 
في هذه الصناعة من خلال منصاتها المتخصمّصة وخدماتها لجمع البيانات. فمثلاً؛ توفر شركة 
52 1 مصادر بيانات لعملائها حول سلوك الشراء بالتجزئة للعملاء. مثالٌ آخر هو شركة 
Experian‏ والتي تجمع بيانات عن كلّ أسرة في الولايات المتحدة. وقد طوّرت شركة Ominiture‏ 
تقنيةً لجمع نقرات الويب ومشاركة هذه البيانات مع عملائها. وتُعَذُ شركة ١0۲ء١٠٠‏ إحدى 
كبرى الشركات في هذا المجال. وتقوم »1ع00© بتجميع بيانات لواقع الإنترنت الفردية وتقوم 
بعمل مُلخص متاح من خلال خدمات تحليلات جوجل. ومن الأمثلة الأخرى شركات <81145: 
jgg .Aventiong «Epsilong .Merkles .Acxioms <TransUniong‏ أن يشمل ذلك أيضاً 
منظمات ESRLorg Jis‏ والتي توفر بيانات مُوجَّهة بمواقع عملائها. وهناك مئات الشركات 
الأخرى التي تقوم بتطوير منصات وخدمات متخصصة لجمع وتكامل ومشاركة هذه البيانات 
مع عملائها. وكما ذكرنا سابقًاء يُوجَد العديدٌ من دامجي ومُورّعي البيانات الخاصة بالصناعة, 
وهم دائمو الحركة لعرض خدمات التحليل الخاصة بهم. وبالتالي؛ يُعَذُ هذا القطاعٌ أيضاً متزايد 
الاستخدام» وموردًا محتملًا لموهبة التحليلات. وخصوصًا مع خبرة مُتخصّصة مُحدّدة. 


مُطوّرو البرامج التي تركّز على التحليلات: 

قامت الشركات في هذه الفئة بتطوير برامج التحليلات للاستخدام العام مع البيانات التي تم 
جمعها في مستودعات البيانات أو المتاحة من خلال إحدى المنصات الأساسية اللُحدّدة سابقًا (بما 
في ذلك البيانات الضخمة). كما يمكن أن تشمل المخترعين والباحثين في الجامعات وغيرها من 
المنظمات التي طوّرت الخوارزميات وابتكار أنواع مُحدَّدة من تطبيقات التحليلات. وهكننا تحديد 
كبار اللاعبين في هذا المجال باستخدام أنواع التحليلات الثلاثة: الوصفية» والتنبؤية» والتوجيهية. 


^ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


- إعداد التقارير/ التحليلات الوصفية: لقد تِسَنّى القيامٌ بإعداد التقارير أو التحليلات الوصفية 
من خلال الأدوات التي وفَّرها مشغلو البرمجيات الوسيطة المشار إليها سابقّاء أو الإمكانات 
الفريدة التي يُقدّمها مُقدّمو الخدمات ال معنيون. فمثلاً؛ تتصَمن مجموعة أدوات 8Q1‏ 
Server B1‏ التابعة لشركة مايكروسوفت os Šla pjäs alas! Slll (Microsoft)‏ 
التحليلات التنبؤية. ومن ناحية أخرى؛ يتوفر gaby‏ متخصصً من شركاتِ أخرى مثل تابلوه 
(ناهعاطة1) لتصوير البيانات. كما تُقدّم 545 أداة التحليلات المرئية ذات السعة نفسها. 
وهناك العديدٌ من أدوات التصوير المجانية أيضاً. وقد تمّ تطويرٌ مئات أدوات تصوير البيانات 
في جميع أنحاء العام وتركّز العديدٌ من هذه الأدوات على رؤية البيانات المتوفرة لصناعة أو 
مجال معين. ولأن التصويرٌ هو الطريق الأساسي حتى الآن لاستكشاف التحليلات في مجال 
الصناعة؛ فقد شَهِدَ هذا القطاع نموًا أكبر. ويتم حاليًا تأسيسٌ العديد من الشركات الجديدة. 
فمثلاً يركز برنامج نطام6 المجاني والمفتوح المصدر على تصوير الشبكات. وسوف يظهر في 
البحث على 600816 أحدث قائمة لمقدّمي مثل هذه البرامج والأدوات. 

- التحليلات التنبؤية: ولعلّ هذه الفئة قد شَهِدّت أكبر نمو في العصر الحديث في مجال التحليلات» 
وهناك عددٌ كبيرٌ من الشركات التي تركّز على التحليلات التنبؤية. وقد تبَنّت العديدٌ من 
شركات البرمجيات الإحصائية, SPSSs SAS Ja‏ التحليلات التنبؤية في وقتِ مبكرء كما طوّرت 
إمكانيات البرامج» وكذلك ممارساتٌ الصناعة لاستخدام أساليب التنقيب في البيانات والأساليب 
الإحصائية الكلاسيكية للتحليلات. ومن أمثلة الأدوات المُستخدّمة للتحليلات التنبؤية IBM-‏ 
Enterprise Miners IBM ù SPSS Modeler‏ من 8۸8. ویشمل اللاعبون الآخرون فی هذا 
ا مجال شركة ××× وStatsofi‏ (التي اشترتها ||26 مؤخرًا) وقداع]5(:5 5011400 وكثيرٌ من 
الشركات الأخرى التي قد تبيع برامجها على نطاق واسع أو تستخدمها في ممارسات الاستشارات 
الخاصة بها (المجموعة التالية من الشركات). 
كما ظهرت ثلاث منصات مفتوحة المصدر ]45,5 425( RapidMiners R)‏ و:10211311) كأدوات 
برمجية شائعة في المجال الصناعي للتحليلات التنبؤية» ولديها شركاتٌ تدعم تدريب وتنفيذ هذه 
الأدوات المجانية. مثل شركة (ls Revolution Analytics‏ 55 على تطوير 11 والتدريب. 
ويكون تكاملٌ 1 ممكنًا مع معظم برامج التحليلات. وتستخدم شركة تدعى 4116576 امتدادات 
۸ لإعداد التقارير والتحليلات التنبؤية» غير أن قوتها تكمُّنُ في تقديم عمليات حلول التحليلات إلى 
العملاء والمستخدمين الآخرين بشكل مشترك. وبالمثل؛ Lal la KNIME; RapidMiner 5l‏ 
أمثلة ممورّدي البرامج مفتوحة bali‏ كما أن شركات مثل 1011600656 التي تبيع متغيرات الملكية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري AV‏ 


الفصل الأول 


Neural Network شركة برمجيات‎ v25 :NeuroDimensionss Decision Tree el, s 
هي أمثلةً على الشركات التي طوّرت برامج مُتخصّصة حول أساليب مُحدّدة للتنقيب في البيانات.‎ 
التحليلات التوجيهية: يُقدَّم مُورّدو البرمجيات في هذه الفئة أدواتٍ النمذجة والخوارزميات؛ من‎ - 
أجل تحسينٍ أمثل للعمليات التي عادةً ما تُسمّى برمجيات علم الإدارة/ بحوث العمليات. وكان‎ 
لهذا المجال مجموعةٌ خاصةٌ من كبار مورّدي البرمجيات. فعلى سبيل المثالء لدى 181/1 برامج‎ 
البرمجة الخطية الكلاسيكيةء وا مختلطةء والبرمجة الصحيحة. وقبل عدة سنوات» استحوذت‎ 
أيضاً على شركة تُدعَى 11.06 والتي تقدَّم خدمات التحليل التوجيهي والخدمات‎ 4 
01/1/15 التكميلية لتُكمّل عروضها الأخرى. ومُقدَّمو التحليلات مثل 545 لديهم أدوات‎ 
s XPRESS (Aus الخاصة بهم - 545/01. واستحوذت شركة 7100 على شركة أخرى‎ 
4112/5 برنامجًا للتحسين. وتشمل الجهات الفاعلة الرئيسة الأخرى في هذا المجال شركات مثل‎ 
«ANGDatas .Maximals «Lindo Systemss .Gurobis .GAMSs Frontlines .AMPLs 
و43 وغيرها الكثير. إن التحديد والوصف التفصيلي لعروض هذه الشركات هو خارج نطاق‎ 
أهدافنا هنا. ويكفي القول بأنَّ هذا القطاع الصناعي قد شَّهِدَ نموًا كبيرًا في الآونة الأخيرة.‎ 
وبالطبع؛ يُوجَد العديدٌ من الأساليب التي تندرج تحت فئة التحليلات التوجيهية. ولكلٌ‎ 
منها مجموعةٌ خاصةٌ بها من مُقدَّمي الخدمات. فعلى سبيل المثال؛ يتم تقديمٌ برامج المحاكاة‎ 
ويوفر 20115306 الأدوات التي‎ Slinks Rockwell (ARENA) Jia (5 55Jl c5 Jl Lö jo 
أدوات للتحسين باستخدام جداول‎ ۴۲٥٣٤1۲۲ تتضمّن العديدَ من فئات البرامج. وبالمثلء تقدّم‎ 
تحليل القرار في إعدادات متعددة‎ las بالإضافة إلى التحليلات التنبؤية. ويمكن‎ «Excel UU, 
الأغراض باستخدام أدوات مثل 010166 6عم8:2. وهناك أيضاً أدوات من شركات مثل 8:55 و‎ 
وغيرها لإنشاء قواعد بشكلٍ مباشر من البيانات أو مدخلات الخبراء.‎ X٤ 
وتتطوّر بعضٌ الشركات الجديدة لتجمع بين نماذج التحليلات المتعددة في مجال البيانات‎ 
الضخمة: بما في ذلك تحليل الشبكات الاجتماعية والتنقيب في تيار البيانات. فعلى سبيل المثاله‎ 
تضمن 45]61 16120243 إمكانيات التحليلات التنبؤية التابعة له في معالجة تدفقات البيانات‎ 
3&5 (CEP) الضخمة. وقد قامت العديدٌ من الشركات بتطوير محرّكات معقدة لمعالجة الأحداث‎ 
(Microsoft) غوسوركيlng‎ IBM Infosphere Streams Jûم قرارات باستخدام بیانات التدفق«‎ 
أمّا الشركاث الكبرى الأخر: ى التي تمتلك منتجات‎ Oracle Event Processors StreamInsights 
3 SAPs dnformaticas .Tibcos «Apache Jمشتف محركات معالجة الأحداث المعقدة؛‎ 
الإشارة مرةً أخرى إلى أن مجموعات المورّد لجميع فئات التحليلات الثلاث ليست‎ 54235 Hitachi 
حصريةً. وفي معظم الحالات؛ يمكن للمورد أن يلعب في مكونات متعددة من التحليلات.‎ 


M‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


ونقدَّم بعد ذلك «البتلات الداخلية» لزهرة التحليلات. ويمكن تسمية هذه المجموعات 
مسرعات التحليلات. وعلى الرغم من أنهم قد لا يشاركون في تطوير التقنية مباشرةٌ؛ فقد لعبت 
هذه المنظمات دورًا رئيسًا في تشكيل هذه الصناعة. 


مُطوّرو التطبيق: صناعة مُحدّدة أو عامة: 

تستخدم ال منظماث في هذه امجموعة معرفتها الصناعيةء وخرتها التحليليةء وحلولها المتاحة للبنية 
التحتية للبيانات» ومستودعات البيانات والبرامج الوسيطة ومجمُعي البيانات ومُقَدّمي برامج التحليل 
الآلي لتطوير حلول مُخصّصة لصناعة معينة. وبالتال؛ تتيح هذه ا مجموعة الصناعية إمكانية استخدام 
تقنية التحليلات في صناعة معينة. وبالطبع؛ قد تُوجَّد مثل هذه المجموعات أيضاً في منظمات مستخدمين 
مُحدَّدة. ومن الواضح أنَّ معظم مُورّدي تقنية التحليلات الأماسيين مثل 181/1: و545: Teradatas‏ 
يتعرفون على فرصة الاتصال بصناعة مُحدّدة أو عميل مُحدَّد وتقديم خدمات استشارية تحليلية. تقوم 
الشركاٹ التي قدّمت بشكل تقليدي حلول بيانات/ تطبيقات لقطاعات مُحدّدة بتطوير عروض تحليلية 
خاصة بالصناعة. فعلى سبيل ال مثال» تقدّم شركة :0626© حلول السجلات الطبية الإلكترونية لمقدّمي 
الخدمات الطبيةء وتشمل عروضها الآن العديد من تقارير التحليلات والمرئيات. وبالمثل, تُقدّم شركة 
Hyaa IBM‏ كشف الاحتيال لصناعة التأمين الصحي؛ وتعمل مع شركة تأمين لاستخدام منصة تحليلات 
2 الشهيرة في مساعدة مُقدّمِي الخدمات الطبية وشركات التأمين في التشخيص وإدارة المرض. 
ومن الأمثلة الأخرى على مُورّدي تطبيقات رأسية Sabre Technologies‏ التي ei‏ حلولًا تحليليةً 
لصناعة السفر ها في ذلك تسعير التعريفات لتحسين الإيرادات وتخطيط الإرسال. 

وتشمل هذه المجموعة أيضاً الشركات التي طوّرت حلول تحليلات خاصة بمجالها وتسوقها 
على نطاق واسع لقاعدة العملاء. وعلى «JULI Jis‏ تقوم jsbxj Sportvisions IBM s «Nike‏ 
تطبيقات في التحليلات الرياضية لتحسين اللعب وزيادة نسبة المشاهدة. Acxioni colo As‏ 
مجموعات لكل المنازل في الولايات المتحدة تقريبًا استنادًا إلى البيانات التي تجمعها حول الأسر 
من مصادر مختلفة. وتنتمي شركات إعداد التقارير ذات الدرجات الائتمانية والتصنيف »۴1٥0(‏ 
وصةتءم<5... إلخ) أيضاً إلى هذه المجموعة. وتقدّم 1823/1 والعديد من الشركات الأخرى حلول 
تحسين الأسعار في قطاع بيع التجزئة. 

ويمثل هذا المجال فرصةً رياديةَ لتطوير تطبيقات خاصة بالقطاع. ويحاول الكثيرون الذين 
يظهرون في تحليلات الويب/ الشبكات الاجتماعية/ المواقع أن يقوموا بتهيئة المستخدمين للاستهداف 
الأفضل للحملات الترويجية في الوقت المناسب. ومن أمثلة هذه الشركات وأنشطتها: تقوم شركة 
باستخدام بيانات الموقع لتطوير ملفات تعريف ال مستخدمين/ المجموعات واستهداف 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۸۹ 


الفصل الأول 


إعلانات الجوال» ومستخدمي ملفات تعريف «ale Towerdata‏ اناسل استخدام البريد الإلكتروني. 
وتهدف شركة 0112114 إلى تحديد المستخدمين من خلال جميع استخدامات الجهازء وتستهدف 
2 نامز الإعلانات التلفزيونية على asa‏ تحليل عادات مشاهدة التلفزيون لدى المستخدم. 

ولقد أنتج نمؤٌ الهواتف الذكية صناعةً كاملةً ترز على تطبيقات تحليلات مُحدَّدة للمستهلكين وكذلك 
المؤسسات. فعلى سبيل اللثال: يمكن لتطبيقات الهواتف الذكية Shazam Jès‏ أو gÍ Soundhound‏ 
115111 تحديد أغنية على أساس المشاهدات القليلة الأولى» ثم السماح للمستخدم باختيارها 
بغرض التشغيل/ التنزيل/ الشراء. وتستخدم 11/826 معلومات المرور الفورية التي يشاركها المستخدمون. 
بالإضافة إلى بيانات الموقع لتحسين التنقل. وتؤدي أدوات التعرّف على الصوت مثل iPhone (Js Siri‏ 
os asas]! JI Amazon Alexas Google Nows‏ تطبيقات التحليلات Laas ASII‏ 
لأغراض مُحدّدة جدًا في التحليلات المطبّقة على الصور ومقاطع الفيديو والصوت والبيانات 
الأخرى التي يمكن التقاطها من خلال الهواتف الذكية و/أو أجهزة الاستشعار المتصلة. لقد 
رفعت الهواتف الذكية أيضاً من مورّدي الخدمات الاقتصادية المشتركة. مثل: ,عداتاء 
-Olas «Curb .Lyfts‏ ]5 العديد من هذه الشركات؛ هي أمثلةٌ للتحليلات التي تؤدي إلى فرص 
أعمال جديدة. وتُعَدٌ وسائلٌ التواصل الاجتماعي عبر الإنترنت مجالًا آخر ساخنًا في هذه المجموعة. 
ومما لا شك فيه أن 12665001؛ هو اللاعب الأساسي في مجال الشبكات الاجتماعية عبر الإنترنت يليه 
L eUS de sg .Linkedlng Twitter‏ الوصول العام إلى بياناتهم أَذَّى إلى ظهور شركات أخرى 
متعددة تقوم بتحليل بياناتها. فعلى سبیل ال مٹال: تقوم Twitter olly Jdæu Unmetric‏ وتوفير 
الحلول لعملائهاء وبا مثلء يُوجَد العديدٌ من الشركات الأخرى التي تركّز على تحليل الشبكات الاجتماعية. 

ومن المجالات الموجّهة في مجال تطوير التطبيقات إنترنت الاشياء 101. وتقومٌ العديدٌ من 
الشركات ببناء تطبيقات لصنع كائنات ذكية. فمثلًاه طوّرت شركة 524۲۲81١‏ أنظمة ال مراقبة 
الذكية عن بُعد لقطاعات النفايات وإعادة التدويرء وتعمل العديدٌ من المنظمات الأخرى على 
بناء العدَّادات الذكية والشبكات الذكية والمدن الذكية والسيارات المتصلة والبيوت الذكية 
وسلاسل التوريد الذكية: والصحة المتصلة والتجزئة الذكية» وغيرها من الأشياء الذكية. 

وينمو هذا النشاط في بداية الأمر ليتحوّل إلى مرحلة انتقالية كبيرة بسبب مشكلات في التمويل/ 
الاستثمار والمشكلات الأمنية/ الخصوصية. وعلى الرغم من ذلك؛؟ فقد يكون قطاع مطوّري التطبيقات 
هو أكبرٌ مجالٍ للنمو داخل التحليلات في هذه المرحلة. وتوفر هذه المجموعة فرصةً فريدةً لمحترفي 
التحليلات الذين يبحثون عن المزيد من خيارات مهنة تنظيم المشاريع. 


q.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


مُحلّلو صناعة التحليلات والمؤثرون فيها: 

وتشمل ال مجموعة التالية من صناعة التحليلات ثلاثة أنواع من المنظمات أو اط محترفين؛ 
المجموعة الأولى هي مجموعةٌ من المنظمات المهنية التي تُقدّم المشورة إلى موردي صناعة 
التحليلات والمستخدمين. تشمل خدماتهم تحليلات تسويقية وتغطية التطورات الجديدة وتقييم 
تقنيات مُحدّدة وتطوير التدريب/ الورقات البيضاء وما إلى ذلك. ومن أمثلة هذه اللجموعة 
منظمات مثل مجموعة جارتنر.ء ومعهد مستودعات البيانات. وتعادع::ه180 „McKinsey g‏ 
والعديد من المنشورات العامة والفنية ومواقع الويب التي تغطي صناعة التحليلات. وتتميز 
مجموعة ماجيك كوادرانتس التابعة لمجموعة جارتنر بكونها مؤثرةً للغاية وتعتمد على عمليات 
امسح في الصناعة. وبا مثلء $g‏ محترفو 21171.01" لمحات عامة ممتازة عن الصناعة, وهم 
يدركون تمامًا الاتجاهات الحالية والمستقبلية لهذه الصناعة. 

وتضمٌ المجموعة الثانية مجتمعات أو شركات مهنية تقدّم أيضاً بعضًا من الخدمات نفسها؛ 
ولكنها قائمةٌ على أساس منظم. فعلى سبيل المثال: igre OYI Sy‏ بحوث العمليات وعلم الإدارة 
5 2 وهي شركةٌ مهنيةء على تعزيز التحليلات. وتركز مجموعة المصالح الخاصة لدعم 
القرار والتحليلات» وهي مجموعة فرعيةٌ تابعةٌ لرابطة نظم المعلومات» أيضاً على التحليلات. كما 
أنَّ لدى معظم المورّدين الرئيسيين (مثل: تيراداتاء و545) مجموعات المستخدمين الخاصة بهم. 
وتشجّع هذه الكيانات استخداح التحليلات وتمكّن من مشاركة الدروس المستفادة من خلال 
منشوراتها ومؤتمراتهاء وقد توفر أيضاً خدمات التوظيف. وبالتاليه مصادر جيدة لتحديد المواهب. 

أمّا المجموعة الثالثة من المحلّلِين في مجال التحليلات؛ فهي ما نسميه سفراء التحليلات» أو 
المؤثرين» أو القائمين بالدعاية. وقد أبدى هؤلاء المحلّلون حماسهم للتحليلات من خلال حلقاتهم 
الدراسية؛ وكتبهم ومنشورات أخرى: وتشمل هذه المجموعة على سبيل المثال لا الحصر 5]676 
«bill Frankss Wayne Eckersons .Charles Duhiggs .Tom Davenports .Baker‏ 3 
«bill Inmans .Claudia Imhoff5 Malcolm Gladwell‏ وغيرهم. ولدى ds‏ هؤلاء السفراء 
مؤلفات (بعضها من الكتب الأكثر مبيعًا) و/أو قدَّموا العديدَ من العروض التقديهية لترويج تطبيقات 
التحليلات. وقد يكون هناك مجموعة أخرى من المؤثرين لذكرها هناء وهم مؤلفو الكتب المدرسية 
عن تحليلات ذكاء الأعمال الذين يهدفون إلى مساعدة المجموعة التالية لإنتاج محترفي صناعة 
التحليلات. ومن الواضح أنَّ الأمر سبيستغرق بعض الوقت؛ لكي يصبح طالبٌ التحليلات عضوًا في 
هذه المجموعة؛ ولكنه يستطيع العمل مع أعضاء من هذه المجموعة كالباحثين أو المتدربين. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Y‏ 


الفصل الأول 


المعاهد الأكاديمية ووكالات الاعتماد: 


5 


تستمدٌ أي صناعة كثيفة المعرفة» مثل التحليلات؛ قوتّها الأساسية من جذب الطلاب المهتمين 
بالتقنية واختيار هذه الصناعة كمهنة لهم. وتلعبٌُ الجامعات دورًا d à La)‏ ذلك JS‏ 
وتُقدّم هذه المجموعة» البرامج الأكادهية التي تُعَدَّ المهنيين لهذه jaa yag delal‏ مكونات 
مختلفة من كليات إدارة الأعمالء مثل نظم المعلومات والتسويق وعلوم الإدارة. وما إلى ذلك. 
izg LS‏ إلى ما هو أبعد من المدارس التجارية لتشمل أقسام علوم الحاسب والإحصاء والرياضيات 
والهندسة الصناعية في جميع أنحاء العالم. GUIS izg LS‏ لتشمل ما يتجاوز مُطوّري الرسومات 
الذين يُصمّمون طرقًا جديدةً لتصوير المعلومات. وتقدّم الجامعات برامج البكالوريوس والدراسات 
العليا في التحليلات في جميع هذه التخصصات. على الرغم من اختلاف التسميات. وقد اشتملت 
إحدى نطاقات النموٌ الرئيسة في برامج الشهادات على التحليلات؛ لتمكين المتخصّصين الحاليين من 
إعادة تدريبهم وإعادة تنظيم أنفسهم في وظائف التحليلات. وتمكّن برامج الشهادات الممارسين 
من اكتساب الكفاءة الأساسية في برامج معينة عن طريق الحصول على عدد قليلٍ من الدورات 
المهمة بالمدارس التي تقدّم هذه البرامج. وتتضمّن شبكة جامعة تيراداتا قائمةٌ ببرامج التحليلات؛ 
والتي تشملٌ KÄ Gaby ٠٥۰‏ وتتزايد يوميًا. 

وتساعدٌ مجموعةٌ أخرى من اللاعبين في تطوير الكفاءة في التحليلات. وهذه هي برامج 
الشهادات التي تمنحُ شهادة الخبرة في برامج مُحدّدة. ويقدّم US‏ موردي التقنية الأساسية تقريبًا 
[أي بي إم (1821): ومايكروسوفت JSbsls «(Microstrategy) comibus Sols (Microsoft)‏ 
(©0:21): وإس إيه إس (545): وتابلوه (0اه181) وتيراداتا (16720842)]؛ برامج الشهادات 
الخاصة بها. وتضمّن هذه الشهاداتٌ أن يتمتع الموظفون المحتملون الجُّدد بمستوّى معين من 
الأدوات المهارية. ومن ناحية أخرى؛ تقدّم 12170181315 برنامج ژشlkة Certified Analytics‏ 
41 والذي يهدف إلى اختبار الكفاءة التحليلية العامة لشخص ما. أي إِنَّ هذه 
الشهادات تمنح الطالب الجامعيّ مهارات إضافيةٌ قابلةً للتسويق. 1 

X sd‏ نمو البرامج الأكاديمية في التحليلات أمرًا مذهلا. ويُحدّد الوقت فقط ما إذا كانت هذه 
المجموعة تفرط في زيادة السعة التي يمكن أن تستهلكها المجموعات الأخرى. ولكن في هذه 
المرحلة. يبدو أن CAI‏ يفوق المعروض من خريجي التحليلات ال مؤهلين» وهذا هو ال مكان الأكثر 
وضوحًا للعثور على مستخدمي التحليلات المبتدئين على الأقل. 


ay‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


المنظمون وصُنَّاع السياسات: 

يُعتَبر اللاعبون في هذا المكوّن مسؤولين عن تحديد القواعد واللوائح الخاصة بحماية موظفي» 
eM aes‏ وحاملي أسهم منظمات التحليلات. ويتطلّب جمعٌ ومشاركةٌ بيانات العميل قوانينَ 
صارمةً لتأمين الخصوصية. تقوم عدة منظمات في هذا المجال بتنظيم عملية نقل البيانات وحماية 
حقوق المستخدمين. فعلى سبيل المثال: تَنظّم لجنة الاتصالات الفيدرالية (©©8) الاتصالات بين 
الدول والاتصالات الدولية. وبالمثل. فإن لجنة التجارة الفيدرالية (55©0) هي المسؤولة عن 
عرض الممارسات التجارية غير المشروعة المتعلقة بالبيانات. ويُنظَّم الاتحاد الدولي للاتصالات 
(ITU)‏ الوصول إلى تقنية المعلومات والاتصالات (10:15) للمجتمعات غير المخدومة في جميع 
أنحاء العام. ومن ناحية أخرى؛ يُوجَّد وكالةٌ فيدراليةٌ غير نظامية تُسمَّى المعهدٌ الوطني للمعايير 
والتقنية (21157). تساعد على تقدِّم البنية التحتية للتقنية. كما أنَّ هناك doas]‏ من المنظمات 
الأخرى في جميع أنحاء العالم التي تنظم أمن البيانات وتدفع عجلة صناعة التحليلات. وهذا 
ae osse‏ في النظام البيني» وبالتالي لا يمكن لأحد أن يُسِيء استخدامَ معلومات المستهلكين. 

وبالنسبة لأيّ شخصٍ يقومٌ بتطوير أو استخدام تطبيقات التحليلات» ربما يكون من الضروري 
أن يكون هناك شخصٌ ما في الفريق على علم بالإطار التنظيمي. ومن الواضح أنَّ هذه الوكالات 
والمنظمات المهنية التي das‏ معهم يقدّمون مواهبَ ومهارات فريدةً في مجال التحليلات. 
منظمات مُستخدمي التحليلات: 

من الواضح أنَّ هذا هو المحركٌ الاقتصادي لصناعة التحليلات بأكملهاء وبالتالي؛ فإننا نئل هذه 
المجموعة باعتبارها جوهرٌ زهرة التحليلات. وإذا لم يكن هناك مستخدمون؛ فلن تكون هناك 
صناعةٌ تحليلات. إن المنظمات في كل صناعة» بغض النظر عن حجمها وشكلها وموقعها؛ تستخدمٌ 
أو تستكشف استخدام التحليلات في عملياتها. وتشمل هذه المنظمات القطاع الخاصء والحكومة, 
والتعليم» والعسكريةء وما شابهها؛ بل وتشمل المنظمات في جميع أنحاء العام. وهناك أمثلة على 
استخدامات التحليلات في صناعات مختلفة كثيرة. ويستكشف آخرون فرصًا مماثلةً ‏ لحاولة الحصول 
على مَيْزَة تنافسية أو الاحتفاظ بها. ولم يتم تحديدٌ شركات مُحدَّدة في هذا القسم؛ وبدلًا من ذلك؛ 
فإن الهدف هنا هو معرفةٌ نوع أدوار محترفي التحليلات التي يمكن أن يلعبها داخل منظمة المُستخدم. 

وبالتاكيد؛ تعد القيادةٌ العليا للمنظمة لا سيما في مجموعة تقنية المعلومات (مسؤول المعلومات» 
وما إلى ذلك)؛ أمرًا بالغ الأهمية في تطبيق التحليلات لعملياتها. ويقول Mars‏ 701165 من إمبراطورية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ar‏ 


الفصل الأول 


5 للشوكولاتة: «إِنَّ جميعَ الإدارات تُغالي في تطبيق الرياضيات على عمليات واقتصاديات الشركة». 
وعلى الرغم من عدم تأيبد عد كاف من كبار المديرين لهذا الرأي؛ فإنَّ الوعي بتطبيق التحليلات 
داخل المنظمة ينمو في كلّ مكان. ولقد أخبرنا مسؤول تنفيذي في شركة تأمين صحي ذات مرة أنَّ 
(المدير التنفيذي) ينظر إلى الشركة كمنظمة تمكن تقنية المعلومات من جمع الأموال من الأعضاء 
اللمؤْمّن عليهم وتوزعها على امورّدين. وهكذا كانت الكفاءة في هذه العملية؛ هي الخاصية التي يمكن 
أن يتفوقوا بها على المنافس. وقد أذّى هذا إلى تطوير العديد من تطبيقات التحليلات لتقليل الاحتيال 
والمدفوعات الزائدة لمقدّمِي الخدمات, وتعزيز العافية بين اممؤمّن عليهم؛ حتى يستخدموا مورّدي 
الخدمات معدل أقل من ال معتادء وتوليد المزيد من الكفاءة في المعالجة» وبالتالي تكون أكثر ربحيةً. 

ومن الناحية الفعلية؛ إن جميع المنظمات الرئيسة في كلّ صناعة محل الاهتمام؛ توظف محترفي التحليلات 
تحت مُسميات وظيفية مختلفة. ويُعَدُ الشكل 16-١‏ تصويرًا لكلمة واحدة من عناوين مختارة من خريجي 
برنامجنا في جامعة أوكلاهوما الحكومية من عام /١17‏ إلى عام 7017. وَيبيّنَ بوضوح أنَّ تحليلات وعلم 
البيانات هي عناوين شائعة في المنظمات التي توظف خريجي هذه البرامج. وتظهر الكلمات الرئيسة الأخرى 
jia‏ مصطلحات مثل امخاطر وقواعد البيانات والأمن. والإيرادات والتسويقء وما إلى ذلك. 





شكل :15-١‏ سحابة الكلمات للألقاب الوظيفية لخريجي برنامج التحليلات 


se‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


وبالطبع؛ تتضمّن منظماتٌ المستخدمين مساراتٍ مهنيةٌ لمحترفي التحليلات للانتقال إلى مواقع 
الإدارة. وتشمل هذه المسميات الوظيفية مديري المشروعاتء وكبار المديرين؛ والقادة وصولًا إلى 
رئيس قسم ال معلومات أو الرئيس التنفيذي. وهذا يشير إلى أنَّ منظمات المستخدمين موجودةٌ 
كمجموعة رئيسة في النظام البيئي للتحليلء وبالتالي يمكن أن يكون مصدرًا جيدًا للمواهب. وربما 
يكون هذا هو المكان الأول لإيجاد محترفي التحليلات في قطاع الصناعة الرأسية. 

وكان الغرضُ من هذا القتسم هو تقديمٌ لمحة سريعة عن مَشهد صناعة التحليلات. وقد تمَّ 
تحديدٌ ١١‏ مجموعةً مختلفةً تلعبُ دورًا ريسا في بناء هذه الصناعة وتعزيزها. ويمكن إضافة 
المزيد من البتلات/ المكونات بمرور الوقت في زهرة/ نظام التحليلات. ونظرًا لأن تحليلات البيانات 
تتطلّب مجموعةً Íe gizo‏ من المهارات؛ ol‏ فهم هذا النظام البيئي ell s,‏ خيارات أكثر مما 
قد تتخيل لمهن التحليلات. وعلاوةً على ذلك؛ هكن للمحترفين الانتقال من مجموعة صناعية إلى 
أخرى للاستفادة من مهاراتها. فعلى سبيل المثال: يمكن للخبراء المحترفين من مُقدَّمِي الخدمات في 
بعض الأحيان الانتقالٌ إلى مراكز الاستشارات: أو مباشرةً إلى منظمات المستخدمين. وبشكل عام؛ 
هناك الكثيدُ مما يثِيدُ الحماسة حول صناعة التحليلات في هذه المرحلة. f‏ 


أسئلة مراجعة على القسم :۸-١‏ 

-١‏ قم بإدراج ١١‏ فتئةً من اللاعبين في النظام البيئي للتحليل. 

؟- أعط أمثلةً لشركات في كل واحد من ال ١١‏ نوعاً من اللاعبين. 

-Y‏ ما هي الشركات المهيمنة في أكثر من فئة؟ 

ع- هل من الأفضل أن تكونَ أقوى لاعب في فئة واحدة أو أن تكون نشطًا في فئات مُتعدّدة؟ 


9-١‏ خطة الكتاب: 


لقد منحتك الأقسامٌ السابقةٌ فهمًا لحاجة تقنية المعلومات في صُنع القرارء وتطور ذكاء الأعمال» 
والآن إلى التحليلات وعلم البيانات. وقد قدَّمنا في الأقسام العديدة الأخيرة نظرةً ale‏ على أنواع 
مختلفة من التحليلات وتطبيقاتها. والآن نحن مستعدون للقيام برحلة إرشادية أكثر تفصيلًا في 
هذه المواضيع» إلى جانب بعض الخبرة العملية العميقة في بعض الموضوعات الفنية» ويوضّح 
الشكل ١0-١‏ خطةً حول بقية الكتاب. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 40 


الفصل الأول 


الاتجافات النستقبلية 




















mu 
مفاهيم رادواث‎ 

تعليلات النص الاتجافاك الستقلية 

كه والويب والخصوصية 
dl Jay SERA‏ والاعبارك 
الاجتماعي الادارية فى التحليلاث 























شكل :10-١‏ خطة الكتاب 
في هذا الفصل؛ تم عرض مقدمة وتعريفات ونظرة عامة على أنظمة دعم القرار 2555 وذكاء 
الأعمال والتحليلات» ها في ذلك تحليلات البيانات الضخمة وعلم البيانات. كما قذَّمنا نظرةً عامة 
على النظام البيئي للتحليلات لتقدّر مدى اتساع وعمق هذه الصناعة. ويُعْطي الفصلان الثاني 
والثالث المسائل التحليلية الوصفية والبيانات. وتشكّل البيانات غالبًا الأساس لأيّ تطبيق تحليلي. 
وبالتالي نقومٌ بعرض مقدمة حول مسائل مستودعات البيانات والتطبيقات والتقنيات. ويغطي 
laf guil lio‏ تقنيات وتطبيقات التقارير وتطبيقات الأعمال. ويتبع ذلك نظرة عامة مختصرة 
على أساليب وتطبيقات إدارة أداء الأعمال /821: وهو الموضوع الذي كان جزءًا أساسيًا من ذكاء 
الأعمال التقليدي. 
hag‏ القسم التالي التحليلات التنبؤية؛ إذ يُقدِّم الفصل الرابع مقدمةً لتطبيقات التحليلات 
التنبؤية» ويتضمّن العديدَ من الفنيات الشائعة للتنقيب في البيانات وهي: التصنيف والتجميع 
وأساليب الترابط» وغيرها. ويركّز الفصلٌ الخامس على تطبيقات التنقيبب في النضٌّ بالإضافة إلى 
تحليلات الويب. بما في ذلك تحليلات وسائل التواصل الاجتماعي وتحليلات المشاعر. وغيرها 
من الموضوعات ذات الصّلة. وَيُعَطي الفصل السادس التحليلات التوجيهية. ويتضمّن الفصل 
السابع مزيدًا من التفاصيل حول تحليلات البيانات الضخمة. ويتضمّن الفصلٌ الثامن مناقشة 
الاتجاهات الحديثة الظهور. مما يؤدي إلى انتشار كلّ من الأجهزة اللاسلكية: وأجهزة «GPS‏ 





۹1 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
































نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


وأجهزة الاستشعار الأخرى وإنشاء قواعد بيانات ضخمة جديدة وتطبيقات فريدة من نوعها. 
وقد بدأت مجموعةٌ جديدةٌ من شركات التحليلات في الظهور لتحليل قواعد البيانات الجديدة 
هذه؛ من أجل فهم أفضل وأكثر عمقًا لسلوكيات وتصرّفات العملاءء وهو ما يؤدي إلى وَضع آلية 
للتخليلات والتوشّع إلى مجال جديد يسم إنترنت الأشياء 10137 ويغْطٌي:الفصلٌ أيضاً التحليلات 
ا مستندة إلى السحابة. Mysig‏ يحاول الفصلٌ الثامن أيضاً دمج جميع المواد التي يغطيها هذا 
الكتاب» ويُختتم هناقشة موجزة لأبعاد الأمان/ الخصوصية في التحليلات. 


٠١-١‏ مواردء وروابطء واتصال شبكة جامعة تيراداتا: 
يمكن تعزيرٌ استخدام هذا الفصل ومعظم الفصول الأخرى في هذا الكتاب من خلال الأدوات 
الموضّحة في الأقسام التالية. 
الموارد والروابط: 
نوصي بالموارد والروابط الرئيسة التالية: 
The Data Warehousing Institute (tdwi.org)‏ - 
Data Science Central (datasciencecentral.com)‏ - 


- DSS Resources (dssresources.com) 


- Microsoft Enterprise Consortium (enterprise.waltoncollege.uark.edu/mec.asp) 


المورّدون والمنتجات والنسخ التجريبية: 
يُقدّم معظمٌ المورّدين نسخًَا تجريبية بمنتجاتهم وتطبيقاتهم. وتتوافر معلوماتٌ حول المنتجات 
والبنية والبرمجيات على -dssresources.com‏ 
النشرات الدورية: 
نوصي بالنشرات الدورية التالية: 
Decision Support Systems (www.journals.elsevier.com/decision-support-systems)‏ - 


- CIO Insight (cioinsight.com) 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري av‏ 


الفصل الأول 


اتصال شبكة جامعة تيراداتا: 

يرتبط هذا الكتاب ارتباطًا وثيقًا بالموارد المجانية التي تقدِّمها شبكةٌ جامعة تيراداتا (انظر: 
.)teradatauniversitynetwork.com‏ وتنقسم بوابة شبكة Sal‏ تيراداتا إلى قسمين رئيسين: أحدهما 
للطلاب, والآخر لهيئة التدريس. وهذا الكتابُ مرتبطً ببوابة شبكة جامعة تيراداتا عبر قسم خاصٌ في 
نهاية كلّ فصل. ويتضمّن هذا القسمُ روابط مناسبةً للفصل المحَدَّد. ويشيرُ إلى الموارد ذات الصّلة. كما 
نقدّم تدريبًا عمليًّا باستخدام البرمجيات وغيرها من المواد (كالحالات) المتاحة في شبكة جامعة تيراداتا. 


موقع الكتاب على الإنترنت: 

موقع هذا الكتاب على الإنترنت 52: .pearsonhighered.com/sharda‏ ويحتوي dle‏ ن 
إضافّ تكميلي منظم كفصول ويب تتوافق مع فصول الكتاب المطبوع. ويتمٌ سَرْد مواضيع هذه 
الفصول في جدول محتويات الفصل عبر الإنترنت. 

وَيُّرجَى ملاحظة أنه في أثناء مثول هذا الكتاب للطباعة؛ تحققنا من أن جميع مواقع الويب 
التي تمّ الاستشهادٌ بها كانت نشطة وصالحة. وعلى أي حال؛ تكون عناوين 0۸1 ديناميكية. 
كما تتغيرُ أحيانًا مواقع الويب التي نشيرٌ إليها في النص أو تتوقف بسبب تغيير الشركات لأسمائها 
أو شرائها أو بيعها أو دمجها أو تعطلها. وفي بعض الأحيان تكون مواقع الويب تحت الصيانة أو 
الإصلاح أو إعادة التصميم. وقد أسقطت العديدٌُ من المؤسسات البادئة ”700“ من مواقعها؛ 
ولكن البعض الآخر لا يزال يستخدمها. وإذا واجهتك أي مشكلة في الاتصال بموقع الويب الذي 
نذكره؛ فيُرجََى التحلي بالصبر وببساطة قم بعمل بحث على الويب؛ لمحاولة تحديد الموقع الجديد 
المحتمّل. والذي في الغالب سيمكنك العثور عليه بسرعة من خلال أحد محركات البحث الشائعة. 
ولا يسعنا إلا أن نعتذر مقدمًا عن هذا الإزعاج. 
تلخيص gaY‏ نقاط الفصل: 
- أصبحت بيئة الأعمال أكثْرَ تعقيدًا وتتغير بسرعة؛ مما يجعل اتخاذ القرار أكثر صعوبةً. 
- يجب أن تستجيب الشركاث» وتتكيف مع بيئة التغيير بسرعة عن طريق اتخاذ قرارات أسرع وأفضل. 
- إن الإطار الزّمني لاتخاذ القرارات يتقلّصء في حين أن الطبيعة العالمية لصُّنع القرار آخذة في 

التوسع؛ مما يستلزم تطوير واستخدام نظم إدارة أمن البيانات المحوسبة. 
- تستخدم أنظمةٌ دعم القرار البيانات والنماذج وأحيانًا إدارة امعرفة لإيجاد حلول للمشكلات 
شبه المهيكلة وبعض المشكلات غير الهيكلية. 


sA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


- تستخدم طرق ذكاء الأعمال مستودعًا مركزيًا يُسمّى مستودع البيانات» والذي هكن من التنقيب 
في البيانات بكفاءة وتصوير البيانات. 

- وتشمل بنيةٌ ذكاء الأعمال مستودعات البيانات وأدوات تحليل الأعمال اللمستخدّمة من قبل 
المستخدمين النهائيين وواجهة المستخدم (مثل لوحات المعلومات). 

- تّستخدم العديدٌ من المنظمات التحليلات الوصفية لتحلّ محل تقاريرها التقليدية المُسطّحة مع 
التقارير التفاعلية التي pä‏ رؤى واتجاهات وأنماط في بيانات المعاملات. 

- تمكن التحليلاتٌ التنبؤية المؤسسات من وَضْع قواعد تنبؤية تُشجّع نتائج الأعمال من خلال 
تحليل البيانات التاريخي للسلوك الحالي للعملاء. 

- تساعد التحليلاتٌ التوجيهية في بناء النماذج التي تنطوي على أساليب التنبؤ والأمثلية على أساس 
مبادئ تقارير التشغيل وعلم الإدارة؛ لمساعدة المنظمات على اتخاذ قرارات أفضل. 

- يركز تحليل البيانات الضخمة على مجموغات البيانات الكبيرة غير المهيكلة» والتى 
قد تتضمّن أيضاً أنواعًا مختلفة مامًا من البيانات للتحليل. i‏ 

- تُعرف التحليلات كمجال بأسماء التطبيقات الخاصة بالصناعة» مثل التحليلات الرياضية» وهو 
Lad ona‏ بأسماء أخرق ذات ele Jta dLo‏ البيانات أو خلم الشيكة: 

- إِنَّ الرّعاية الصحية وسلاسل بيع التجزئة؛ هما مجالان تكثر فيهما تطبيقات التحليلات» والكثير 
من المجالات قادمة. 

- يمكن النظرٌ إلى النظام البيئي للتحليل لأول مرة على أنه مجموعةٌ من مُقدّمِي الخدمة 
والمستخدمين والميسرين. يمكن تقسيمها إلى ١١‏ مجموعةً. 


مصطلحات أساسية: 


التحليلات الوصفية 


التحليلات حة ال معلومات 2 
EE‏ (او إعداد التقارير) 


معالجة المعاملات الفورية (01:55) | النظام البيئي للتحليلات |التنقيب في البيانات 











تخليلات البيآناث الضخمة القرار أو التحليلات المعيارية | وكلاء الذكاء 
التحليلات التنبؤية ذكاء الأعمال (81) المعالجة التحليلية الفورية (1.88©) 
التحليلات التوجيهية حدما الوب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري aq‏ 























الفصل الأول 


أسئلة للمناقشة: 

-١‏ قم بإجراء مَْح الدراسات منذ الأشهر الستة الماضية؛ للعثور على تطبيق واحدٍ لکل من َم 
دعم القرار 05S‏ وذكاء الأعمال والتحليلات. ولخّص التطبيقات في صفحة واحدة, وأرسلها 
x35 ue ga‏ 

-Y‏ ميّز بين ذكاء الأعمال ونظام دَعْم القرار. 

-Y‏ قارن وميّز بين التحليلات التنبؤية والتحليلات الوصفية والتحليلات التوجيهية. استخدم الأمثلة. 

6- ناقش المشكلات الرئيسة في تطبيق ذكاء الأعمال. 


تمارين شبكة جامعة تيراداتا (10[11) وغيرها من التمارين اليدوية: 
elazzubs .teradatauniversitynetwork.com |J! «3l -‏ كلمة مرور الموقع التي يقدّمها 
معلمك» قم بالتسجيل في الموقع إذا لم تكن قد قمتّ بالتسجيل مسبقًا. قم بتسجيل الدخول 
وتعرّف على محتوى الموقع. سوف تتلقى المهمات المتعلقة بهذا الموقع. قم بإعداد قائمة تضم 
٠‏ عنصرًا على الموقع تعتقد أنها قد تكون مفيدةً لك. 
"- اذهب إلى موقع شبكة جامعة تيراداتا. استكشف صفحة Sports Analytics‏ وقم بتلخيص 
اثنين على الأقل من تطبيقات التحليلات في أيّ رياضة من اختيارك. 
-Y‏ ادخل إلى موقع شبكة جامعة تيراداتا. وحَدّد «الحالات والمشاريع والواجبات». ثم اختر دراسة 
«Harrahs High Payoff from Customer Information» à JUJl‏ أجب عن الأسئلة 
التالية حول هذه القضية: 
-١‏ ما هي المعلومات التي تنتج عن التنقيب في البيانات؟ 
؟- كيف تكون هذه المعلومات مفيدةً للإدارة في صُنع القرار؟ (كن دقيقًا.) 
۴- اذكر أنواع البيانات التي يتم التنقيب فيها. 
-٤‏ هل هذا تطبيق 088 أو 81؟ وطاذا؟ 
alb ¢59 <teradatauniversitynetwork.com d| o —s`l -€‏ الورقة بعنوان «مستودعات 
البيانات يدعم إستاتيجية الشركة في أول شركة أمريكية» ش (بواسطة ههلا 
وحده:<11"1 وعناط[6000). اقرأ الورقة. وأجب عن الأسئلة التالية: 
-١‏ ما هي دوافع مشروع مستودع البيانات / ذكاء الأعمال في الشركة؟ 


Y‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


-١‏ ما هي المزايا الإستراتيجية التي تحققت؟ 
*- ما هي المزايا التشغيلية والتكتيكية التي تحققت؟ 
ع- ما هي عوامل النجاح الحسّاسة بالنسبة للتنفيذ؟ 

-o‏ انتقل http://analytics-magazine.org/issues/digital-editions J|‏ وقم بإیجاد 
إصدار يناير / فبراير 17١٠م‏ بعنوان «مشكلة خاصة: مستقبل الرعاية الصحية». 
اقرأ «التحليلات التنبؤية - إنقاذ الأرواح وخفض الفواتير الطبية». أجب عن الأسئلة التالية: 

-١‏ ما هي المشكلة التي يتم تناولها من خلال تطبيق التحليلات التنبؤية؟ 

۲- ما هي درجة الالتزام بأدوية ©8100؟ 

*- كيف يتم التدريبُ على نموذج التنبؤ بأدوية ©8100؟ وهل صئّف نموذج التنبؤ درجة 
التزام الدواء في $FICO‏ 

-٤‏ قم بتكبير الشكل ٤‏ واشرح أيّ نوع من الأساليب يتم تطبيقه على النتائج المتولدة. 

-٥‏ اذكر بعض القرارات القابلة للتطبيق التي تمّ استخدامها بناءً على نتائج التنبق. 

1- ilتJa J|‏ editions-magaine.org/issues/digital-tp://analyticsاh.‏ وقم بإیجاد 
إصدار يناير/ فبراير ٠١1‏ «العمل الاجتماعي». واقرأ المقالة «البيانات الضخمة والتحليلات 
والانتخابات». وأجب عن الأسئلة التالية: 

-١‏ ما هي أنواع البيانات الضخمة التي تمَّ تحليلها في المقالة 006؟ علّق على بعض مصادر 
البيانات الضخمة. 

۲- اشرح مصطلح النظام ا متكامل. وما هو المصطلح الفني الآخر الذي يتناسب مع النظام امتكامل؟ 
۴- ما هي أنواع أساليب تحليل البيانات المُستخدّمة في المشروع؟ ule (ale‏ بعض المبادرات 
التي نتجت عن تحليل البيانات. 

-٤‏ ما هي مشكلات التنبؤ المختلفة التي حلّتها النماذج؟ 

-٥‏ اذكر بعض القرارات القابلة للتطبيق التي تم اتخاذها والتي تستندٌ إلى نتائج التنبق. 

a5 -1‏ تطبيقين لتحليلات البيانات الضخمة غير المُدرّجة في المقالة. 

۷ ابحث في الإنترنت عن اللمواد المتعلّقة بعمل المديرين ويلعب دور تحليلات. ما هي أنواع 
المصادر للشركات الاستشارية والأقسام الأكاديمية والبرامج التي تجدها؟ ما هي المجالات 
الرئيسة التي تمَّ إعادة تصميمها؟ حَدَّد خمسة مواقع تغطي مجالاً واحداً. قدِّم نتائجك. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 11 


الفصل الأول 


-A‏ استكشف ال مناطق العامة من 170م.5ع055565011. قم بإعداد قائمة بالموارد المتاحة الرئيسة. 
قد ترغب في الرجوع إلى هذا الموقع في أثناء عملك من خلال الكتاب. 

9- اذهب eè .microstrategy.com d!‏ بإيجاد معلومات عن الأنماط الخمسة من ذكاء الأعمال» 
قم بإعداد جدولٍ ملخص „hè JS‏ 

Hyperion ksl) de älg coracle.com (JI Jà3l -V-‏ ضمن التطبيقات. حَدّد ما هي منتجات 
الشركة الرئيسة. اربطها بتقنيات الدعم المذكورة في هذا الفصل. 

-١‏ انتقل إلى موقع أسئلة شبكة جامعة تيراداتا. ابحث عن مقاطع فيديو 851. راجع مقطع 
الفيديو الخاص ب of Retail Tweeters»‏ ع025». ثم قم بإعداد ملخص مكوّن من صفحة 
واحدة للمشكلة والحل المقترّح والنتائج التي تمَّ تقديمها. ويمكنك أيضاً العثور على الشرائح 
المقترنة على „slideshare.net‏ 

-١١‏ قم بمراجعة قسم النظام البيئي لبرنامج التحليلات. وحَدَّد ما لا يقل عن شركتين إضافيتين 
فيما لا يقل عن خمس مجموعات من الصناعات المذكورة في المناقشة. 

۴- شملت ال مناقشة ا متعلقة بالنظام البيئي التحليلي أيضاً العديد من عناوين الوظائف النموذجية 
لخريجي برامج تحليل وعلم البيانات. ابحث عن مواقع الويب مثل .26521عءءءدمع 02005 
tdwi.orgg com‏ لتحديد مالا يقل عن ثلاثة عناوين وظيفية مشابهة أخرى قد تجدها 
مشوقةً في حياتك المهنية. 


er‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


المراجع: 


- Capcredit.com. (2015). *How Much Do Americans Spend on Sports Each Year?" capcredit.com/how- 
much-americansspend-on-sports-each-year/(accessed July 2016). 

- CDC.gov. (2015, September 21). "Important Facts about Falls." cdc.gov/homeandrecreationalsafety/ 
falls/adultfalls.html (accessed July 2016). 

- CenterPointEnergy.com. *Company Overview." centerpoint energy.com/en-us/Corp/Pages/Company- 
overview.aspx (accessed June 2016). 

- Chiguluri, V., Guthikonda, K., Slabaugh, S., Havens, E., Peña, J., & Cordier, T. (2015, June). Relationship 
between diabetes complications and health related quality of life among an elderly population in 
the United States. Poster presentation at the American Diabetes Association 75th Annual Scientific 
Sessions. Boston, MA. 

- Cordier, T., Slabaugh, L., Haugh, G., Gopal, V., Cusano, D., Andrews, G., & Renda, A. (2015, September). 
Quality of life changes with progressing congestive heart failure. Poster presentation at the 19th Annual 
Scientific Meeting of the Heart Failure Society of America, Washington, DC. 

- Davenport, T., & SAS Institute Inc. (2014, February). Analytics in sports: The new science of winning. sas. 
com/content/dam/SAS/en us/doc/whitepaper2/iia-analytics-insports-106993.pdf (accessed July 2016). 

- Davenport, T. H., & Patil, D. J. (2012). Data scientist. Harvard Business Review, 90, 70-76. 

- Dundas.com. *How Siemens Drastically Reduced Cost With Managed BI Applications." dundas.com/ 
resource/get case study? case Study Name — 09-03-2016-SiemensZ2FDundas-BI-Siemens-Case-Study. 
pdf (accessed July 2016). 

- Emc.com. (n.d.). “Data science revealed: A data-driven glimpse into the burgeoning new field”. emc. 
com/collateral/about/news/emc-data-science-study-wp.pdf (accessed July 2016). 

- Gartner, Inc. (2004). Using business intelligence to gain a competitive edge. A special report. 

- Gates, S., Smith, L. A., Fisher, J. D., et al. (2008). Systematic review of accuracy of screening instruments 
for predicting fall risk among independently living older adults. Journal of Rehabilitation Research and 
Development, 45(8), 1105-1116. 

- Gill, T. M., Murphy, T. E., Gahbauer, E. A., et al. (2013). Association of injurious falls with disability 
outcomes and nursing home admissions in community living older persons. American Journal of 
Epidemiology, 178(3), 418-425. 

- Gorry, G. A., & Scott-Morton, M. S. (1971). A framework for management information systems. Sloan 
Management Review, 13(1), 55-70. 

- Keen, P. G. W., & M. S. Scott-Morton. (1978). Decision support systems: An organizational perspective. 
Reading, MA: Addison-Wesley. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري er‏ 


الفصل الأول 


- Havens, E., Peña, J., Slabaugh, S., Cordier, T, Renda, A., & Gopal, V. (2015, October). Exploring the 
relationship between health-related quality of life and health conditions, costs, resource utilization, and 
quality measures. Podium presentation at the ISOQOL 22nd Annual Conference, Vancouver, Canada. 

- Havens, E., Slabaugh, L., Peña, J., Haugh, G., & Gopal, V. (2015, February). Are there differences in 
Healthy Days based on compliance to preventive health screening measures? Poster presentation at 
Preventive Medicine 2015, Atlanta, GA. 

- Humana. 2016 progress report. populationhealth. humana.com/wp-content/uploads/2016/05/ 
BoldGoal2016ProgressReport l.pdf (accessed July 2016). INFORMS. Analytics section overview. 
informs.org/Community/Analytics (accessed July 2016). 

- NCAA, National Center for Catastrophic Sports Injury Research Report. NCAA Sport Injury fact sheets 
are produced by the Datalys Center for Sports Injury Research and Prevention in collaboration with the 
National Collegiate Athletic Association, and STOP Sports Injuries. Women's soccer injuries. ncaa.org/ 
sites/default/files/NCAA 'W Soccer Injuries WEB.pdf (accessed July 2016). 

- Pajouh Foad, M., Xing, D., Hariharan, S., Zhou, Y., Balasundaram, B., Liu, T., & Sharda, R. (2013). 
Availableto-promise in practice: An application of analytics in the specialty steel bar products industry. 
Interfaces, 43(6), 503-517. dx.doi.org/10.1287/inte.2013.0693 (accessed July 2016). 

- Price Waterhouse Coopers Report. (2011, December). Changing the game: Outlook for the global 
sports market to 2015. pwc.com/gx/en/hospitality-leisure/pdf/changing-the-game-outlook-for-the- 
global-sportsmarket-to-2015.pdf (accessed July 2016). 

- Sap.com. (2013, October). A “Smart” Approach to big Data in the Energy Industry. sap.com/bin/ 
sapcom/cs_cz/downloadasset.2013-10-oct-09-20.a-smart-approach-to-big-data-in-the-energy- 
industry-pdf.html (accessed June 2016). 

- Sharda, R., Asamoah, D., & Ponna, N. (2013). Research and pedagogy in business analytics: Opportunities 
and illustrative examples. Journal of Computing and Information Technology, 21(3), 171-182. 


- Siemens.com. About Siemens. siemens.com/about/en/(accessed July 2016). 
- Silvaris.com. Silvaris overview. silvaris.com/About/(accessed July 2016). 
- Simon, H. (1977). The New Science of Management Decision. Englewood Cliffs, NJ: Prentice Hall. 


- Tableau.com. Silvaris augments proprietary technology platform with Tableau’s real-time reporting capabilities. 
tableau.com/sites/default/files/case-studies/silvaris-businessdashboards 0.pdf (accessed July 2016). 


- teradatauniversitynetwork.com. (2015, Fall). BSI: Sports analytics— Precision football (video). teradatauniversity 
network.com/About-Us/Whats-New/BSI-Sports-Analytics-Precision-Football/(accessed July 2016). 


vi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل الثاني 
التحليلات الوصفية )١(‏ 
طبيعة البيانات: النمذجة الإحصائية, تصوير البيانات 


: 
أهداف التعلم: 
- فهم طبيعة البيانات من حيث صلتها بذكاء الأعمال والتحليلات. 
- تعلّم الطرق المُستخدمة لتجهيز تحليلات البيانات الواقعية. 
- وَضْف النمذجة الإحصائية وعلاقتها بتحليلات الأعمال. 
- تعلّم الإحصاء الوصفي والاستدلالي. 
- تعريف تقارير الأعمال» وفهم تطؤرها التاريخي. 
- فهم أهمية تصوير البيانات/ المعلومات. 
- تعلّم أنواع مختلفة من تقنيات التصوير البياني. 
- تقدير القيمة التي تضيفها التحليلاث المرئية إلى تحليلات الأعمال. 
- معرفة قدرات وقيود لوحات ال معلومات. 

في عصر البيانات الضخمة وتحليلات الأعمال التي نعيش فيها؛ لا هكن إنكار أهمية البيانات. 
وهناك عبازات مُستَحدَثة مثل: «البيانات هي النقط»» «البيانات هي اللحم الجذيد» «البيانات 
هى العملة الجديدة»» و«البيانات هى الملك»: هذه العبارات من شأنها أن تزيدَ من أهمية البيانات 
3 جديد. ولكن عن أيّ نوع من البيانات نتحدث؟ من الواضح أننا لا نتحدث عن أي بيانات. 
9l‏ مفهوم / مبدأ المدخلات السيئة ينتج عنه مخرجات ,41 "garbage in garbage out-GIGO"‏ 
ينطبق على ظاهرة «البيانات الضخمة» في الوقت الحالي أكثر من أيّ بيانات في أيّ وقت سابق. ولكي 
تتمكّن البياناث من الوفاء بوعدها وقيمة اقتراحها وقدرتها على التحؤل إلى رؤية واقعية؛ فلا بد من 
الاعتناء بإنشائها/ تحديدهاء وكذلك جمعها وتكاملها وتنظيفها وتحويلها ووضعها بصورة صحيحة 
في السياق المناسب لاستخدامها في اتخاذ القرارات بدقة وفي الوقت المناسب. 

تُكَدَّ البياناتٌ الموضوعٌ الرئيس لهذا الفصل. ووفقًا لذلك؛ يبدأ الفصل بِوَضصْفٍ لطبيعة البيانات: 
ماهية البيانات؟ وما هي الأنواع والصور المختلفة التي يمكن أن تظهر بها البيانات؟ وكيف 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yo‏ 


الفصل الثاني 


يمكن معالجتها مسبقًا وتجهيزها للتحليلات؟ يتم تخصيصٌ الأجزاء القليلة الأولى من الفصل 
لفهم ومعالجة البيانات بشسكلٍ عميق وضروري. كما تقوم أجزاءٌ قليلة بعد ذلك Abg‏ الطرق 
الإحصائية المُستخدّمة لتحضير البيانات كمدخلات لإنتاج كلّ من المقايبس الوصفية والاستدلالية. 
ثم يلي الأجزاء الإحصائية أجزاءٌ تتعلّق بالتقارير وتصوير البيانات. يُعَدُ التقريرٌ أداةً اتصال 
تم إعداذها لغرض مُحدَّدء وهو تحويل البيانات إلى معلومات ومعرفة وترحيل تلك المعلومات 
بتنسيق قابل للفهم/ الاستيعاب. ف الوقت الحاليء يتم الاهتمام أكثر بتوجيه هذه التقارير 
dijs jin‏ وغالبًا ما ex‏ ذلك باستخدام الألوان والرسوم البيانية» والتي تبدو بشكل عام 
كلوحة معلومات الغرض منها تحسين محتوى تلك المعلومات. وبالتالي؛ تمّ تخصيصٌ الجزء الأخير 
من الفصل للأقسام الفرعية التي تُعنَى بعرض التصميم والتنفيذ. وكذلك الطريقة المثلى لتصوير 
المعلومات والشرح التفصيلي وعرض لوحات تلك المعلومات. 
١"‏ مقال افتتاحي: قيام ال 511015501 بجذب وإشراك جيل جديدٍ من 
مستخدمي الراديو باستخدام التسويق المبني على البيانات: 

La‏ المحظة الإذاعية الفضائية SiriuSXM‏ أكبرَ شركة إذاعية في العاط؛ إذ تُحقق عائدات 
سنوية تبلغ ۲,۸ مليار دولارء وتقوم بِبَثّ مجموعة واسعة من الموسيقى الشعبية والرياضة 
والأخبار والحديث وفقرات الترفيه. وقد بدأت البثّ في عام ٠٠٠١١‏ بعدد 000٠٠١‏ مشترك. إلى أن 
وصلت إلى 18,8 مليون مشترك في عام ٠٠١4‏ واليوم لديها ما يقربٌ من ۲۹ مليون مشترك. 

يرجع الجزءٌ الأكبرُ من النموٌ الذي حققته شركة 511105131 حتى الآن إلى الترتيبات الإبداعية 
مع شركات تصنيع السيارات. واليوم تمّ تمكينٌ ما يقارب من ۷١‏ > من السيارات الجديدة من 
SiriusXM à S,‏ ومع ذلك؛ فقد امتدًّ أثرُ الشركة لما هو أبعد من أجهزة الراديو في الولايات 
المتحدة ألا وهو التواجدٌ العالمي على الإنترنت والهواتف الذكية وأيضًا التواجد من خلال خدمات 
وقنوات توزيع أخرى. ا في ذلك -Dishs JetBlues SONOS‏ 
S‏ الأعمال: 

على الرَّغْم من هذه النجاحات الرائعة؛ فإنه في غضون السنوات القليلة الماضية ونتيجةً 
للتغ يرات التي طرأت على كل من التركيبة السكانية للعملاء» والتقنية» وأيضًا حصة المنافسين 
من السوق؛ فقد أدّى ذلك كله إلى ظهور سلسلة جديدة من تحَدَّيات الأعمال والفرص التجارية 
لشركة SiriusXM‏ ونعرض فيما يلي بعضاً من أبرز تلك التحديات والفرص: 


m‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصقية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


- مع زيادة مُعدَّل انتشار السيارات الجديدة في السوق؛ فقد تغيّرت التركيبةٌ السكانية للمشترين؛ 
فقد أصبحت أصغر سنًاء مع دخل تقديري أقل. كيف يمكن هنا أن تتعرف شركة SiriusXM‏ 
على هذه التركيبة السكانية الجديدة؟ 

- مع استعمال السيارات الجديدة ومن ثم بيعها كسيارات مستعملة لمالكين جُددء كيف يمكن هنا 
SiriusXM J‏ |9 2353 هؤلاء المالكين الجدد. وتحوّلهم إلى عملاء مباشرين؟ 

- تمكَنت شركة 5151005134 من تقديم خدماتها عبر كلّ من الأقمار الصناعية والشبكات اللاسلكية؛ 
وذلك بعد استحواذها على أعمال المركبات المترابطة من شركة 48650 - والتي تُعتبر الشركة 
الرائدة في مجال تقنيات المعلومات في سوق السيارات بالولايات المتحدة الأمريكية - فكيف 
يمكنها استغلال هذه الصفقة بنجاح للحصول على مصادرجديدة للدخل؟ 


الحلّ المُقترّح: تحويل الرؤية نحو التسويق المستند إلى البيانات: 
اعترفت شركة ax SiriusXM‏ لمواجهة هذه التحَدّيات؛ فإنَّ عليها أن تصبح منظمة تسويق عالية 
الأداء ومستندةً على البيانات. بدأت الشركة في إجراء هذا التحؤل من خلال إنشاء ثلاثة مبادئ أساسية: 
- أولًا: التفاعلات الشخصية - وليس التسويق الجماعي - من شأنها أن تحكم اليوم. وسرعان ما 
فهمت الشركة أنه لإجراء المزيد من التسويق الشخصي؛ فعليها الاعتماد على التاريخ والتفاعلات 
السابقةء وكذلك على الفهم الشديد بموقع المستهلك من دورة حياة الاشتراك. 
- ثانيًا: للوصول إلى هذا القدر من الفهم؛ ستحتاج تقنية المعلومات وشركاؤها في التقنية الخارجية 
إلى القدرة على تقديم بيانات متكاملةء وتحليلات متقدّمة. ومنصات تسويق متكاملة؛ وأنظمة 
توصيل مُتعدّدة القنوات. 
- ثالنًَا: قد لا تتمّكّن الشركة من تحقيق أهدافها التجارية دون وجود وجهة نظر متكاملة ومتسقة 
بهاء والأهم من ذلك؛ يجب أن تتحول الجوانب التقنية والتجارية في 1»×Mء1؟‏ إلى شركاء حقيقيين 
edu‏ على نحو أفضل للتحديات التي تواجهها في أن تصبح منظمة تسويقيةً عالية الأداء ومعتمدة 
على الأفكار المستندة على البيانات للتحدّث مباشرةً مع المستهلكين بطرق ملائمة بشكلٍ ملحوظ. 
تلك الأفكارٌ المبنية على البيانات» على سبيل ال مثال» ستّمكّن الشركة من التفريق بين ا مستهلكين 
والخلاك والسائقين والمستمعين وأصحاب الحسابات. كما ستساعدٌ هذه الأفكار شركة ]/111510,ز5 
على فهم تلك المركبات والخدمات الأخرى التي تُشكّل gib láo öl JS oa ja‏ فرص جديدة 
للمشاركة. بالإضافة إلى ذلك» ومن خلال إنشاء رؤية شاملة وموثوقة بزاوية 1١‏ درجة لجميع 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vv‏ 


الفصل الثاني 


مستهلكيهاء تستطيع 5111015001 ضمان أن تكون جميع الرسائل في جميع الحملات والتفاعلات 


مُصمَّمةً وملائمَةَ ومتسقةً عبر جميع القنوات. والنقطة المهمة أيضًَا هي أن يكون التسويقٌ 
الأفضل تصميمًا وفعالية هو عادةً الأقل تكلفة. 


التنفيذ: إنشاء ومتابعة المسار المؤدي إلى التسويق عالي الأذاء: 
في الوقت الذي قرّرت فيه أن تصبح شركةٌ تسويق عاليةً الأداء؛ كانت ]511105003 تعمل مع منصة 
تسويق خارجية لا تمتلك القدرة على دعم طموحات SSiriusXM‏ فاتخذت الشركة قرارًا مستقبليًا مهما 
يهدف إلى رفع قدراتها التسويقية الداخلية» ومن ثم رسمت بعناية ما يلزم القيامٌ به لتحقيق ذلك بنجاح. 
-١‏ تحسين نظافة البيانات من خلال تحسين إدارة البيانات الرئيسية والحوكمة. وعلى الرغم 
من نفاد صبر الشركة في وَضْع الأفكار موضع التنفيذ؛ فإنَّ نظافة البيانات كانت خطوةً أولى 
وضروريةً لإنشاء نافذة موثوقة في سلوك المستهلكين. 
- نقل نشاط التحليلات التسويقية إلى داخل الشركة وتوسيع حجم البيانات؛ لرفع كفاءة تلك 
التحليلات وتقديم دعم كاملٍ ومتكاملٍ لها. 
- تطوير نماذج جديدة للتصنيف والتسجيل لتفعيل قاعدة البيانات: والقضاء على التأخر في 
الاستجابة وتكرار البيانات. 
-E‏ توسيع حجم البيانات المتكاملة لتشمل بيانات التسويق والتسجيلء والاستفادة من تحليلات قاعدة البيانات. 
-O‏ اعتماد منصة تسويقية لتطوير الحملات. 
ÚS b5 -1‏ تلك القدرات معًا؛ لتحقيق إدارة العروض في وقتِ ملائم عبر جميع قنوات التسويق: 
مركز الاتصال» والتليفونات الخلويةء ومواقع الإنترنت» والتطبيقات الجاهزة. 
ِنَّ إكمال كلّ تلك الخطوات يعني العثور على شريك التقنية المناسب. فوقع اختيار 
5111051 على تيراداتا؛ إذ شكّلت نقاطٌ قوتها رابطةً قويةً بين المشروع والشركة؛ فكانت تيراداتا 
قادرةً على القيام بما يلي: 
- دمج مصادر البيانات مع مستودع بيانات (IDW) Jal&za‏ وتحليلات متقدمة» وتطبيقات تسويق قوية. 
obl doll cis cS. de -‏ 
- تقليص معنوي في حركة البيانات عبر قواعد بيانات وتطبيقات مُتعدّدة. 
- سلاسة التفاعل مع التطبيقات الجاهزة والوحدات النمطية لجميع مجالات التسويق. 


YA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


- القياس والتنفيذ بمستويات عالية جدًا؛ بهدف تشغيل الحملات والتحليلات ضمن قاعدة البيانات. 
- فتح قنوات اتصال في وقتٍ ملائم مع العملاء. 
- تقديم الدّعم التشغيلي (سواءً عبر السّحابة أو في أماكن العمل). 

وقد مكّنّت شركة تيراداتا شركة 5111015101 من التحرّك بسلاسة وبسرعة على امتداد خارطة 
الطريق التي رسمتها لنفسهاء والشركة الآن في خضم عملية تحؤلية مدتها خمس سنوات. وبعد 
تأسيسها لعملية إدارة البيانات القوية» بدأت 51511015031 من خلال تنفيذ مستودع بيانات متكاملة 
dal‏ والذي مكّن الشركة بسرعة وبطريقة فعّالة في تفعيل رؤيتها الجديدة في جميع أنحاء المنظمة. 

قامث الشركة بعد ذلك بتنفيذ ما يُسمَّى ”مدير التفاعل مع العملاء“ - وهو جزءٌ من برنامج 
LS ylsz Jelàl &2 ($3.71 - Integrated Marketing Cloud L3laljs‏ مع العميل في الوقت 
الملائم؛ وذلك عبر مجموعة كاملة من قنوات الاتصال الرقمية والتقليديةء وأيضًا يسمح بالتعاون 
بين 5151115734 ومركز الرسائل الرقمية ل تيراداتاء 

وستتيح تلك الحزمة من الإمكانيات المجتمعة لشركة 515111510/1 التعاملّ مع الاتصالات 
المباشرة عبر قنوات مُتعددة. كما أن هذا التطؤر سوف يتيحٌ العروض في الوقت الملائم» وكذلك 
الرسائل التسويقية والتوصيات بناءً على السلوك السابق. 

وبالإضافة إلى تبسيطها لكيفية تنفيذ وتحسين الأنشطة التسويقية الصادرة؛ تتحكّم /0510اف:ز5 أيضًا 
في عمليات التسويق الداخلية الخاصة بها بالتنسيق مع إدارة الموارد التسويقية» والذي أيضًا يُعَدُ جز 
Integrated Marketing Cloud blal;5 5a‏ وسيسمح هذا NT‏ لشركة 51131151141 بتبسيط سَيْر 
العمل؛ وتحسين الموارد التسويقية: ورفع الكفاءة من خلال كلّ قرش من ميزانية التسويق الخاصة بهم. 
النتائج: حَصْد الفوائد: 

بينما الشركة تواصل تطؤرها لتصبح منظمةً تسويقيةً عالية الأداء؛ إذ 5151015111 تستفيدٌ بالفعل 
من إستراتيجيتها المنفّذة بعناية. تعمل كلّ من إحصاءات المستهلك على مستوق الأسرة والرؤية 
الكاملة لإستراتيجية اللمس التسويقية مع كلّ مستهلك على تمكين 515105131 من إنشاء عروض 
أكثر استهداقًا على مستوى JS‏ من الأسرة والمستهلكين والأجهزة. ومن خلال جعل قدرات البيانات 
والتحليلات التسويقية من ضمن أنشطة الشركة الداخلية» تمكّنت 5151005131 من تحقيق الآي: 
- الحصول على نتائج الحملة فورًا تقريبًا بدلا من 6 أيام؛ مما يؤدي إلى تخفيضات هائلة في مُعدَّل 

الدوران الزمني للحملات والمحلّلِينَ الداعمين لها. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1۹ 


الفصل الثاني 


- الحصول على رؤية دائرية مُغلقة تسمح للمحلَّلين بدعم الحوارات المتعددة المراحل وإجراء 
تعديلات داخل الحملة لزيادة فعاليتها. 
- الحصول على نمذجة وتسجيلٍ فوري؛ لرفع مستوى الذكاء التسويقي وشَّحُْذ عروض الحملات 
والاستجابات بسرعة تلائم أنشطة الشركة التجارية. 
ls‏ عررّت تجربة 51105331 فكرةً أنَّ التسويق العالي الأداء يَُذّ مفهوماً يتطور باستمرار. 
كما قامت الشركة بتنفيذ كلّ من العمليات والتقنية التي تمنحها القدرة على النموٌ المستمرٌ والمرن. 


أسئلة على المقالة الافتتاحية: 

Gl do TSiriusXM Jus ll -Y‏ نوع من السوق تقوم بأعمالها؟ 

ko -Y‏ التحَدَّيات التي واجهتها؟ مع التعليق على كلّ من التقنية والتحَدّيات المتعلقة بالبيانات. 

“- ما الحلول المقترحة؟ 

-٤‏ كيف قامت الشركة بتنفيذ الحلول المقترحة؟ وهل واجهوا أيّ تحديات في أثناء التنفيذ؟ 

ه- ماذا كانت النتائج والفوائد؟ وهل كانت تستحقٌ الجهد/ الاستثمار؟ 

- هل كنك التفكير في شركات أخرى تواجه تحَدّيات مماثلةء ويمكنها الاستفادة من الحلول 
التسويقية المشابهة القائمة على البيانات؟ 


ماذا يمكننا أن نتعلّم من هذه المقالة القصيرة؟ 

في سعيها إلى النجاح ضمن بيئة صناعة تنافسية سريعة التغيّر؛ أدركت 5<01نال,ز5 الحاجة 
إلى بنية تحتية تسويقية جديدة ومُطوّرة (والتي تستندٌ إلى البيانات والتحليلات)؛ وذلك لتوصيل 
القيمة المقترحة بفعالية لعملائها الحاليين وا محتملين. وكما هو الحال في أيّ صناعة, أو في الترفيه؛ 
يعتمد النجاحٌ أو البقاء طويلًا على استشعار النزعات المتغيرة (التفضيلات وعدم التفضيلات) 
بذكاء عالِء ووَضْع الرّسائل الصحيحة والسياسات المناسبة معَا؛ بهدف كسب عملاء جُدد مع 
الإبقاء على العملاء الحاليين. الغرض هنا؛ هو إنشاء وإدارة الحملات التسويقية الناجحة التي 
يتردد صداها مع السكان المُسِتَهدَفين من العملاء الذين يعكسون حُزمة من ردود الأفعال وثيقة 
الصّلة؛ تهدف إلى ضبط وتعديل الرسالة من أجل تحسين ا مخرجات. ف النهاية؛ كان الأمرٌ 
يتعلق كليًا بدقة الطريقة التي تم اتباعها في الأنشطة التجاريةء وهي أن تكون سبًاقًا بشأن 
الطبيعة المتغيرة للعملاء وأيضًا توفير المنتجات والخدمات المطلوبة في الوقت المناسب للعميل؛ 


M‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائية. تصوير البيانات 


وذلك باستخدام كاملٍ لإستراتيجية التسويق القائمة/ المعتمدة على البيانات. وقد لعب كل من 
يديل وإنشاء اللضادن والوضول إإلثها ése‏ وذكافلها وتنطيقها وتعويلها وتخزيتها ومعالجتها 
للبيانات محل الدراسة دورًا مهما في نجاح 5110501 في تصميم وتنفيذ إستراتيجية تحليلية 
تسويقية» كما هو الحال في أيّ شركة ناجحة في الوقت الحاضر باستخدام الذكاء التحليلي» بغض 
النظر عن الصناعة التي يشاركون فيها. 


۲-۲ طبيعة البيانات: 

AS‏ البيانات هي العنصر الرئيسي لأَيّ مبادرة (ذكاء أعمال)» وعلم البيانات» وتحليلات الأعمال. 
في الواقع؛ يمكن اعتبارٌ البيانات أنها المادة الخام لما تنتجه هذه التقنيات الشائعة لاتخاذ القرار 
من معلومات ورؤية ومعرفة. وبدون بيانات ما كان لأيّ من هذه التقنيات أن تظهر أو تنتشر 
وعلى الرغم من أننا قمنا - وبشكلٍ تقليدي - ببناء نماذج تحليلية باستخدام كلّ من معرفة وخبرة 
الخبراء ببيانات قليلة جدًا أو بدون بيانات على الإطلاق: على JS‏ حال كان ذلك في السابق أمّا الآن 
فقد أصبحت البيانات ركيزةً أساسيةً في كلّ ذلك. ونظراً لكون عع والغزيق وإدارة البيانات من 
أكبر التحَدّيات؛ فإنها تُعَنُ ssl)‏ البيانات) ضمن أغلى وأنمن أصول أيّ منظمة. مع إمكانية إنشاء 
رؤية لا تُقدّر بثمن لفهم العملاء وا منافسين وعمليات الأعمال بشكلٍ أفضل. 

يمكن أن تكون البياناتٌ صغيرةً ويمكن أن تكون كبيرةً جدًا. ومن الممكن أن تكون البيانات 
مُهيكلةً (مُعدّة بصورة جيدة للتعامل مع أجهزة الحاسب»» أو يمكن أن تكون غير مهيكلة (على 
سبيل المثال: يتم إنشاءٌ نص يدويٌ» وبالتالي لا يمكن فهمه/ التعامل معه بواسطة أجهزة الحاسب). 
ومن الممكن أن تأي البيانات دائمًا في مجموعات صغيرة أو تتقولب دفعة واحدة في مجموعة 
أكبر. هناك بعضٌ الخصائص التي تُحدّد الطبيعة المتأصلة للبيانات الآن» والتي نسميها في الغالب 
البيانات الضخمة أو الكبيرة الحجم. وعلى الرغم من أن هذه الخصائص للبيانات تجعلها أكثرَ 
صعوبةً في المعالجة والاستخدام؛ فإنها تزيدُ من قيمتها؛ لأنها تجعلها أكثر إثراءً للدراسة بعيدًا 
عن مفاهيمها المألوفة؛ مما يسمح باكتشاف معرفة جديدة ومبتكرة. لقد انقضى زمنُ الطرق 


Sources: Quinn, C. (2016). Data-driven marketing at SiriusXM. Teradata Articles & News. at http://bigdata. 
teradata.com/US/Articles-News/Data-Driven-Marketing-At-SiriusXM/(accessed August 2016); Teradata 
customer success story. SiriusXM attracts and engages a new generation of radio consumers. http://assets. 
teradata.com/resourceCenter/downloads/CaseStudies/EB8597.pdftprocessed-1. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري MW‏ 


الفصل الثاني 


التقليدية لجمع البيانات يدويًا (إمَّا عن طريق الاستطلاعاتء أو عبر معاملات تجارية مباشرة) 
asas OUT las dos‏ لجمع البيانات الحديثة التي تستخدم الإنترنت و/أو أجهزة الاستشعار/ 
8515 المعتمدة على الشبكات المحوسبة. إن هذه الأنظمة الآلية لجمع البيانات لا تمكّننا فقط 
من جمع مزيدٍ من البيانات؛ ولكن أيضًا ترفع من جودة البيانات» وتؤكّد على سلامتها. ويُوضّح 
الشكل ١-١‏ سلسلة التحليل النموذجية - بيانات إلى تحليلات إلى معلومات قابلة للتنفيذ. 


عملية الأعمال 

















شكل "-1: بيانات الاستمرارية وال معرفة 

وعلى الرّغم من المكانة الثمينة التي تحتلها البيانات والتي لا يمكن إنكارها؛ فإنه يجبُ أن 
تلتزمَ البياناثٌ ببعض القياسات الأساسية ذات الجودة والقابلية للاستخدام. ومن ا معلوم أنه 
ليست كل البيانات مفيدةً لجميع المهام؛ إذ يجبٌ أن تتطابق البياناث مع المهمة المراد استخدام 
تلك البيانات فيها بجانب تغطية التفاصيل الخاصة بتلك المهمة. وبالنسبة لأيّ مهمة مُحدَّدة؛ 
يجبٌ أن تتوافق البيانات المتاحة مع متطلبات الجودة والكمية. وبشكل أساسي؛ لا بد من تجهيز 
البيانات للتحليلات. والسؤال هنا ما هو تجهيز البيانات للتحليلات؟ فبالإضافة إلى ضرورة ملاءمتها 
للمشكلة jas‏ البحث ومتطلبات الجودة/الكمية؛ يجب أن يكون للبيانات هيكلٌ معينٌ يتماثى 
مع الحقول/المتغيرات الرئيسة مع القيم الطبيعية الصحيحة. علاوةً على ذلك؛ يجب أن يكون 
هناك تعريفٌ متفقٌ عليه على مستوى اللؤسسة للمتغيرات والموضوعات الشائعة (أحيانًا تُسمّى 


wY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





التحليلات الوصقية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


أيضًا إدارة البيانات الرئيسة)» مثل كيفية تعريف العميل (ما هي خصائص العملاء المستخدّمة 
لإنتاج تمثيلٍ شاملٍ بما يكفي للتحليلات) وفي أيِّ مرحلة من النشاط التجاري يتم الحصولٌ على 
المعلومات المتعلقة بالعميل والتحقّق منها وتخزينها وتحديثها. 
في بعض الأحيان؛ قد يعتمدٌُ تمثيل البيانات على نوع التحليلات المستخدّمة. ale.‏ ما 
تتطلّب الخوارزميات التنبؤية بشكلٍ عام وجود ملفٍ ثابت مع متغير مُستَهِدَف؛ لذا فإنَّ 
تجهيز تحليلات البيانات للتنبؤ؛ يعني ضرورةً تنسيق مجموعات البيانات على هيئة ملف 
مُسطّح مع تجهيزها للدخول في تلك الخوارزميات التنبؤية. كما أنه من الضروري أيضًا مطابقة 
البيانات مع متطلبات برمجيات خوارزمية التنبؤ - على سبيل المثال: تتطلّب خوارزميات 
الشبكة العصبية التمثيل العددي لكل المتغيرات Ól oia) i‏ المتغيرات الاسمية تحتاج 
مثل هذا التحويل الرقمي). والتعامل بسهولة مع مزيج من المتغيرات الاسمية والرقمية. 
غالبا ما تصل مشروعاث التحليلات Lebl dalas gil‏ امتعلقة بالبيانات إلى إجابات غير 
ملائمة للمشكة محل البحثء وقد تؤدي هذه الإجابات التي تم الوصول إليها عن غير قصد 
والتي قد 945 aee‏ إلى اتخاذ قرارات غير دقيقة وغير ملائمة. ونعرضٌ فيما يلي بعض الخصائص 
(المقاييس) التي تُحدّد مستوى جاهزية البيانات لإجراء دراسة تحليلية Delen. 2015. Kock)‏ 
(Corner. 19975 McQueens‏ 
- موثوقية مصدر البيانات: يشير إلى أصالة وملاءمة وسيط التخزين الذي يتم الحصولٌ على 
البيانات من خلاله - والسؤال هنا هو ”هل لدينا ثقةٌ تامةٌ في مصدر البيانات هذا؟» إذا كان 
ذلك ممكنًا؛ فيجبٌُ علينا داتمًا أن نبحث عن المصدر الأصلي/المنشأ الأصلي لتلك البيانات؛ وذلك 
بهدف إزالة/ تقليل احتمال تشويه البيانات وتحويل البيانات الناتجة عن سوء ال معالجة في 
أثناء نقل البيانات من مصدرها إلى وجهتها التالية على مرحلة واحدة أو أكثر؛ إذ إِنَّ كلّ تحرك 
للبيانات يعطي فرصةً لإسقاط أو إعادة صياغة بنود تلك البيانات عن غير قصد؛ مما يَحِدّ من 
سلامة مجموعة البيانات وربما دقتها الحقيقية. 
- دقة محتوى البيانات: يعني أنَّ البيانات صحيحةً ومطابقةٌ بشكلٍ جيد لمشكلة التحليلات - وهنا 
سِؤالٌ آخر*هل لدينا البيانات الضحيحة للمهمة المطلوبة؟ يجث أن تمثل البياناثٌ الهدف 
الذي تمّ تحديده من خلال المصدر الأصلي للبيانات. فعلى سبيل المثال: يجب أن تكون 
معلوماتٌ التواصل مع العميل المسجّلة في قاعدة البيانات هي نفس ما قاله العميل شخصيًا. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wr‏ 


الفصل الثاني 


هذا وسيتمٌ تناول موضوع دقة البيانات بمزيد من التفصيل في الفقرة التالية من هذا الفصل. 

- إمكانية الوصول إلى البيانات: يعني أن البيانات يمكن الحصول عليها بسهولة ويُسر - وذلك بالإجابة 
عن السؤال التالي ”هل يمكننا الوصولٌ بسهولة إلى البيانات عندما نحتاج إليها؟“ قد يكون الوصول 
إلى البيانات خادعًا؛ ol‏ إذا كانت مستودعات البيانات في E‏ من Bs‏ ووسط تخزين وتحتاج 
إلى دمج/ تحويل عند الوصول إليها والحصول عليها. ومع velis‏ دور أنظمة إدارة قواعد البيانات 
العلائقية التقليدية (أو تعايشها مع) dm dam‏ من وسائط مستودعات البیانات» مثل: بحيرات 
البيانات» والبنية التحتية 812000 تتزايد في نفس الوقت أهمية/ حساسية الوصول للبيانات. 

- حماية وخصوصية البيانات: يعني أنَّ البيانات متاحةٌ فقط لهؤلاء الأشخاص الذين لديهم 
السّلطة والحاجة إلى الوصول إليها ومَنْع أيّ شخصٍ آخر من ذلك. إن تزايد الرواج في الدرجات 
التعليمية وبرامج شهادات ضمان المعلومات؟ هو دليلٌ على الحاجة الماسَّة والمتزايدة oll‏ 
جودة البيانات هذا. ينبغي على Sl‏ منظمة طبية تحتفظ بسجلات صحية لكل مريض على 
جِدَة؛ أن يكون لديها أنظمة مُطبَّقةٌ لا تقوم فقط بحماية البيانات من وصول أشخاص غير 
مُصرّح لهم إليها (والذي يتم تفويضه بموجب قوانين اتحادية» مثل قانون قابلية التأمين الصحي 
وقابلية التأمين [11084]])؛ ولكنها تُحدّد بدقة السماح وإمكانية الوصول إلى سجلات ÍS‏ 
مريض من قبل الأشخاص المُصرّح لهم بذلك (2003 ,كقصصة). 

- ثراء البيانات: يعني أن جميعَ عناصر البيانات المطلوبة مُدرَّجةٌ في مجموعة البيانات. في الأساس؛ 
يعني الثراء (أو الشمولية) أن المتغيّرات المتاحة تُصور بُعدًا ثريا جما يكفي لدراسة الموضوع 
الأساسي دراسة تحليليةً دقيقةً وقيّمة. ويعني OÍ LÁT‏ محتوى المعلومات مكتملٌ (أو شبه 
مكتمل) لبناء نموذج تحليلات تنبؤية و/أو توجيهية. 

- اتساق البيانات: يعني أنَّ البيانات يتم جمعها بدقة وكذلك دمجها/ تركيبها. وتمثل البيانات 
المتسقة معلومات الأبعاد (متغيرات الاهتمام) الواردة من مصادر متفاوتة الاحتمال ولكنها تتعلق 
بنفس الموضوع. فإذا لم يتم دمج/ تكامل البيانات بشكل صحيح؛ فقد تُوجَد بعص المتغيرات 
الخاصة بموضوعات مختلفة في سجلٍ واحد - مع وجود مجموعتين من السجلات المختلفة للمرضىء 
على سبيل المثال: قد يحدث ذلك في أثناء دمج سجلات بيانات نتائج الفحص السكانية واطرضية. 

- توقيت البيانات: يعني أنَّ البيانات يجب أن يتمّ تحديثها (أو تكون حديثةً/ جديدةً كما يجب أن 
تكون) لنموذج التحليلات ا معطى. كما يعني أن البيانات يتم تسجيلها في وقت الحدث أو الملاحظة 
أو بالقرب منه؛ بحيث يتم مَنْع التحريف المتعلق بالوقت للبيانات (التذكر والتشفير غير الصحيحين). 


ME‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائية. تصوير البيانات 


ونظرًا لأن التحليلات الدقيقة تعتمد على بيانات دقيقة وف الوقت ال مناسب؛ فإن السّمة الأساسية 
للبيانات الجاهزة للتحليلات هي توقيت إنشاء عناصر البيانات والوصول إليها. 

- مستوى تفصيل البيانات: يتطلّبٍ ذلك أن يتم تعريف المتغيرات وقيم البيانات dol ule‏ 
مستوى (أو منخفض بقدر الإمكان) من التفاصيل للاستخدام المطلوب للبيانات. فإذا تم 
تجميعٌ البيانات؛ فقد لا تحتوي على مستوى التفاصيل اللازمة لخوارزمية التحليلات بغرض 
plos‏ طريقة تمييز سجلات/ حالات مختلفة بعضها عن بعض. على سبيل المثال: وفي إطار طبّي 
يتحتم تقريبٌُ القيم العددية للنتائج المعملية إلى الخانة العشرية ال مناسبة للتفسير الهادذف 
لنتائج الاختبار والاستخدام السليم لتلك القيم داخل خوارزمية التحليلات. وبامثلء في مجموعة 
البيانات المتعلقة بالتوزيع السُّكاني؛ ينبغي تعريف عناصر البيانات على مستوّى ملائم لتحديد 
الفروق في نتائج الرعاية بين مختلف المجموعات السكانية الفرعية. شيءٌ واحدٌ يجب علينا 
تذكره هنا؛ هو أنَّ البيانات المُجمّعة لا يمكن تقسيمها (دون الوصول إلى المصدر الأصلي)» ولكن 
يمكن تجميعها بسهولة من تمثيلها الدقيق. 

- صلاحية البيانات: هو المصطلحٌ المُستَخدّم لوصف التطابق/ عدم تطابق بين قيم البيانات 
الفعلية والمتوقعة لمتغيرٍ ما. وكجزء من تعريف البيانات؛ يجب تحديدٌ القيم أو نطاق القيم 
المقبولة S‏ عنصر بيانات. على سبيل المثال: يتضمّن تعريفٌ البيانات الصحيح المرتبط بنوع 
الجنس ثلاث قيم: ذكرء وأنثى» وغير معروف. 

- ملاءمة البيانات: يعني أنَّ المتغيرات في مجموعة البيانات كلها ذات صلة بالدراسة التي تتم. 
ولا تُعَدَُ العلاقة مقياسا ثناقّ التفرّع (كون المتغير مرتبطاً بالدراسة أم لا)» بل يكون لديها 
مجموعة من الروابط من الأقل صلة إلى الأكثر أهميةً. واستنادًا إلى خوارزميات التحليلات 
المستخدمةء قد يختار الدارس فقط تضمين المعلومات الأكثر صلة (أَيْ: المتغيرات) أو إذا كانت 
الخوارزمية قادرةً على تصنيفها؛ فقد يختارٌ تضمين جميع المتغيرات ذات الصّلة بغض النظر عن 
مستوى ارتباطها. هناك أمرّ مهم يجب على دراسات التحليلات تجّبه ألا وهو تضمين بيانات 
غير ملائمة تمامًا في بناء النموذج؛ فقد يؤدي ذلك إلى تلويث المعلومات الخاصة بالخوارزمية؛ 
مما يؤدي إلى نتائج غير دقيقة ومُضلّلة. 

وعلى الرغم من أنَّ هذه المقاييس قد تكون الأكثر شيوعًا؛ OB‏ جودة البيانات الحقيقية 
والاستعداد الممتاز للتحليلات لنطاق تطبيق معين؛ سيتطلبان مستوياتٍ مختلفةً من التركيز على 
Ue) cio ALI obs ed‏ إضافة الايد من التفاصيل Jaba cg Lug Agam] n a‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Mo‏ 


الفصل الثاني 


في الفصل التالي طبيعة البيانات بمزيد من التفاصيل من منظورٍ تصنيفي لسرد أنواع البيانات 
المختلفة وتحديدها من حيث صلتها بمشاريع التحليلات المختلفة. 


أسئلة مراجعة على القسم 7-8: 
-١‏ كيف تصف أهمية البيانات في التحليلات؟ وهل تمكننا التفكيرٌ في التحليلات بدون بيانات؟ 
۲- بالنظر إلى التعريف الجديد والواسع لتحليلات الأعمالء ما هي المُدخلات وا مخرجات الرئيسية 
لاستمرار التحليلات؟ 
*- من أين تأ بيانات تحليلات النشاط التجاري؟ 
-٤‏ في رأيك؛ ما أهم ثلاثة تحديات متعلّقة بالبيانات؛ للوصول إلى تحليلات أفضل؟ 
ه- ما المقايبسٌ الأكثر شيوعًا التي تعمل على تجهيز البيانات للتحليلات؟ 
۳-۲ تصنیف مُبسّط للبيانات: 
تشير البيانات (لا سيما في صيغتها الفردية) إلى مجموعة من الحقائق التي يتم الحصول عليها 
عادةً كنتيجة للتجارب أو المشاهدات أو المعاملات أو الخبرات. وقد تتكوّن البيانات من الأرقام 
والحروف والكلمات والصور والتسجيلات الصوتية وما إلى ذلك» كقياسات لمجموعة من المتغيرات 
(خصائص ال موضوع أو الحدث محل الدراسة). فغالبًا ما يُنظر إلى البيانات على أنها أدنى مستوى من 
التجريد (الغموض) يتم استخلاص معلومات منه» ومن ثم معرفة. أمّا في أعلى مستوى من التجريد؛ 
فيمكن تصنيف البيانات على أنها منظمة وغير منظمة (أو شبه مهيكلة). تتكون البيانات غير/ شبه 
المهيكلة من أيّ مزيج من المحتوى النضّي والصور والصوت ومحتوى الويب. gatus‏ تغطية البيانات 
غير/ شبه المهيكلة بمزيدٍ من التفصيل في فصل تعدين النص وتعدين الويب. أمًا البيانات المهيكلة؛ 
فهي تلك التي تستخدمها خوارزميات التنقيب في البيانات» ويمكن تصنيفها على أنها فئويةٌ أو 
زقمية. ويمكن تقسيمٌ البيانات الفثوية إلى بيأنات اسمية أو ترتيبية» في خين تقشم البيانات الرقمية 
إلى فواصل زمنية أو نِسّب. يُوضّح الشكل 7-؟ تصنيفاً بسيطاً للبيانات. 


wI‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


البيانات فى الت pere‏ 


TET Ó em | [F 
[ 


AME 1 


"ULM | الوسائل‎ |. | 





- y 


XMLUSON.‏ - | سبة أ | ترتيية 





Y-Y J‏ تصنيف بسيط للبيانات 

- بيانات فئوية: تمثّل علامات الفئات المتعدّدة المُستخدّمة لتقسيم متغير إلى مجموعات مُحدّدة. 
وتنضَّمَّن أمثلة المتغيرات الفئوية كالعرق والجنس والفئة العمرية وا مستوى التعليمي. وبالرغم 
من أن المتغيرين الأخيرين قد يتم النظرٌ فيهما أيضًا بطريقة عددية باستخدام قيّم دقيقة للعمر 
وأعلى درجة مكتملة؛ فإنه غالبًا ما يكون أكثرَ إفادةً لتصنيف مثل هذه المتغيرات إلى عدد 
صغيرٍ نسبيًا من الطبقات المرتبة. وقد يُطلّق على البيانات الفئوية أيضَّا بيانات منفصلة؛ مما 
يعني أنها تمثل عددًا محدودًا من القيم دون اتصال بينها. وحتى إن كانت القيم الممُستخدّمة 
للمتغيرات الفئوية (أو المنفصلة) هي قيم رقمية؛ فإنَّ هذه الأرقام ليست أكثرَ من رموز ولا 
تشيرٌ d]‏ إمكانية حساب قيم كسرية. ; 

- بيانات اسمية: تحتوي على قياسات الرموز البسيطة المُخصّصة للأشياء كتسميات؛ ولكنها لا 
تُعتتر قياسات. فعلى سبيل المثال: يمكن تصنيف ا متغير (الحالة الاجتماعية) بشكل عام إلى )١(‏ 
آعزب» (۲) متزوج» (۴) مطلق. كما يكن تمثيل البيانات الاسمية ذات القيم الثنائية بقيمتين 
محتملتين (على سبيل المثال: نعم/ لاء أو صواب/ خطأء أو جيد/ سيء» أو ما إلى ذلك)» أو ذات 
القيم المتعدة بثلاث قيم محتملة أو أكثر (مثل: بني/ أخضر/ أزرق» أو أبيض/ أسود/ لاتيني/ 
آسيويء أو أعزب/ متزوج/ مطلقء أو ما إلى ذلك). 

- البيانات الترقيبية: تحتوي على رموز مُخصّصة للأشياء أو الأحداث كتسمياتء وفي نفس الوقت 
تُعبّر أيضًا عن رُتبة الترتيب فيما بينهم. فعلى سبيل المثال: يمكن تصنيف المتغير (درجة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yw‏ 














الفصل الثاني 


الائتمان) بشكل عام إلى )١(‏ منخفضة» أو (؟) متوسطة» أو (؟) مرتفعة. كما يمكن وَضْعَ 
العلاقات المرتبة الممائلة في متغيرات» مثل: الفئة العمرية (بمعنى: طفلء شابء متوسط 
العمرء مسن)» وا مستوى التعليمي (معنى: المدرسة الثانوية» الكليةء الدراسات العليا). 
- البيانات الرقمية: نمثل القيمٌ العددية لمتغيراتٍ مُحدّدة. وتشمل أمثلة المتغيرات ذات القيمة العددية 
السّنء وعدد الأطفالء ومجموع دخل الأسرة (بالدولار الأمريكي)» ومسافة السفر (بالأميال)» ودرجة 
الحرارة (بمقياس فهرنهايت). كما يمكن أن تكون القيم العددية للمتغير عددًا صحيحًا (بلا كسور) أو 
حقيقية (تشمل الصحيحة بالإضافة إلى الكسور). وقد تُسمّى البياناث الرقمية أيضًا بيانات مستمرة؛ 
مما يعني أنَّ المتغير يحتوي على مقادير متواصلة على مقياس مُحدَّد مما يسمحٌ بإدخال قيم مؤقتة. 
فبخلاف المتغير المنفصل الذي يمثل بيانات محدودة وقابلة للعد. يمثل المتغير المستمر قياسات قابلة 
للتطويرء ومن الممكن أن تحتوي البيانات على عدد لا نهائي من القيّم الكسرية. 
- بيانات فترة: هي مُتغيرات يُمكن قياسها على مقاييس الفواصل الزّمنية. هناك مثالٌ شائعٌ لقياس 
الفواصل الزمنية؛ هو درجة الحرارة المئوية. في هذا المقياس المُحدَّد تكون وحدة القياس ٠٠١ /١‏ 
من الفرق بين درجة حرارة الانصهار ودرجة حرارة الماء المغلي في الضغط الجوي؛ بما يعني عدم 
وجود قيمة صفرية مُطلقة. 
- بيانات نسبية: وتشمل المتغيرات الشائعة للقياس والموجودة في esle‏ الفيزياء والهندسة. ود 
js‏ من المجموعة والطول والوقت وزاوية الطائرة والظافة i ils‏ الكهربائية bs‏ على 
القياسات الفيزيائية التي هي مقائيس az a9 cea)‏ هذا النوع من المقاييس اسمّه من 
حقيقة أنَّ القياس هو تقديرٌ النسبة بين حجم الكمية المستمرة وحجم وحدة من نفس النوع. 
وبشكل غير رسمي؛ EAS‏ المميزة لمقياس النسبة هي وجودٌ خانة صفرية القيمة وغير 
عشوائية. فعلى سبيل المثال: فإنَ مقياس درجة الحرارة كلفن له نقطة صفر غير عشوائية من 
الصفر المطلق» والتي تساوي (-17,10) درجة مئوية. تُعَذ نقطة الصفر هذه غير عشوائية؛ 
لأن الجسيمات التي تشكل المادة عند هذه الدرجة لها طاقةٌ حركيةٌ صفرية. 
يجب تحويلٌ أنواع البيانات الأخرىء كبيانات النصوص والحيّز والصور والفيديو والصوت» 
إلى شكلٍ من أشكال التمثيل الفئوي أو الرقمي قبل أن تتم معالجتُها بواسطة طرق التحليل 
(خوارزميات التنقيب في البيانات؛ 18,2015 2). كما يمكن أيضًا تصنيفٌ البيانات إلى بيانات 
ثابتة أو حركية ssl)‏ سلاسل مؤقتة أو زمنية). A‏ بع طرق التحليلات التنبؤية (مثل: التنقيب 
في البيانات) وخوارزميات تعلم الآلة؛ طرقاً انتقائيةً للغاية لنوع البيانات التي يمكنها التعامل معها. 


MA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائية. تصوير البيانات 


وقد يؤدي الاعتماذ على أنواع بيانات غير متوافقة مع طرق التحليلات إلى الحصول على e‏ 
غير صحيحة أو (في أغلب الأحيان) تُعَثْر عملية تطوير النموذج. فعلى سبيل ال مثال: تحتاج بعض 
طرق التنقيب في البيانات أن يتم تمثيل جميع المتغيرات (سواء مدخلات أو مخرجات) كمتغيرات 
ذات قيمة رقمية (مثل: الشبكات العصبية: آلة المتجهات الداعمة؛ الانحدار اللوجستي). ويتمٌ 
تحويل المتغيرات الاسمية أو الترتيبية إلى تمثيلات رقمية باستخدام أحد أنواع المتغيرات الزائفة من 
١‏ إلى ن Had)‏ يمكن تحويلٌ متغير فئويّ له ثلاث قيم مختلفة إلى ثلاثة متغيرات زائفة ذات قيم 
ثنائية ٠‏ أو .)١‏ ولأن هذه العملية قد تزيدٌ من عدد المتغيرات؛ فلا بد من الحَذر بشأن تأثير هذه 
التمثيلات؛ خاصةً فيما يتعلق بالمتغيرات الفئوية التي تحتوي على أعداد كبيرة من القيم الفريدة. 
وبالمثل؛ تحتاج بعض طرق التحليلات التنبؤية» مثل 1103 (خوارزمية شجرة القرارات الكلاسيكية) 
وا مجموعات الخام (خوارزمية قاعدة الاستقراء الجديدة نسبيًا)ء إلى تمثيل جميع المتغيرات كمتغيرات 
قطعية القيمة. وقد تطلَّبَت الإصداراتٌ القديمة من هذه الطرق من المستخدم أن يقوم بفصلٍ 
وتمثيل المتغيّرات الرقمية في مجموعات فئوية قبل أن تتمّ معالجتها بواسطة الخوارزمية. والخبر 
السَّار؛ هو أنَّ معظم تطبيقات هذه الخوارزميات في أدوات البرامج المتاحة على نطاق واسع تقبل 
مزيجًا من المتغيرات الرقمية والاسمية وتقوم داخليًا بإجراء التحويلات اللازمة قبل معالجة البيانات. 
تظهر البیاناٹ في العديد من أنواع المتغيرات المختلفة والرسومات البيانية. تتحسّن أدواثٌ تحليل 
الأعمال باستمرار في قدرتها على مساعدة علماء البيانات في المهمة الشاقة المتمثلة في تحويل وتمثيل 
البيانات؛ بحيث يممكن تنفيلٌ متطلبات البيانات الخاصة بنماذج وخوارزميات تنبؤية مُحدّدة Si‏ 
صحيح. وتوضّح الحالة العملية ؟-1 سيناريو العمل الذي قامت فيه شركة الأبحاث والتطوير الخاصة 
بالأجهزة الطبية الغنية بالبيانات بتبسيط أنشطة التحليلات لديها؛ بهدف الوصول بسهولة إلى كلّ 
من البيانات والتحليلات التي تحتاجها لمواصلة أعمال الابتكار والجودة بها على أعلى المستويات. 
حالة عملية ٠-۲‏ 
شركة أجهزة طبية تضمّن جودة المنتج مع توفير JUI‏ 
تتطوّر بعضٌ التقنيات بشكل أسرع منها في المجال الطبي؛ لذا فقد يغيّر امتلاك 
برامج التحليلات المتقدّمة المناسبة من قواعد اللعبة. asa dais‏ الأجهزة رائدًا في 
تطوير وتصنيع وتوزيع الأجهزة الطبية والتقنيات المتعلقة بهاء بما في ذلك التقنية التي 
أحدثت ثورةً في اختبارات الدم الكامل والتخثر. وللمساعدة في ضمان استمرار نموّها 
ونجاحهاء تعتمدٌ الشركة على تحليلات البيانات وهع]]5]815 Dell‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wa‏ 


الفصل الثاني 


المشكلة: 

وباعتبارها شركةً رائدةً ف سوق أدوات التشخيص الخاصة بالرعاية الحرجة والتخثر؛ 
لذا يجب أن يستفيد معملُ الأجهزة من التقنيات السريعة التطور مع الحفاظ على d$‏ 
من الجودة والكفاءة في تطوير وتصنيع وتوزيع منتجاته. وعلى وجه الخصوص؛ فقد 
متت الشركة علماءها ومهندسيها في مجالي البحث والتطوير من سهولة الوصول إلى 
ثروة غزيرة من البيانات ومن ثم تحليلهاء بجانب الكفاءة في مراقبة عمليات التصنيع 
وسلاسل التوريد. 

يوضّح جون يونغ» محلل الأعمال لمعمل الأجهزة: «مثل العديد من الشركات. كنا أغنياء 
بالبيانات؛ ولكن فقراء في التحليل؛ فلم يَعُد من الممكن أن ينجح مُحللو البحث والتطوير في 
الوصول إلى تقنية المعلومات في كلّ مرة يحتاجون فيها إلى الوصول إلى بيانات الاختبارء ومن 
ثم إجراء تحليلات لمرة واحدة $ J Minitab‏ يجبٌ أن يكون لديهم القدرة على الوصول إلى 
البيانات بسرعة وإجراء تحليلات مُعقّدة بشكلٍ متسق ودقيق». 

Lås OS‏ تحليلات متطوّرة لمعمل الأجهزة أمرًا حسَاسا؛ وذلك بسبب حجم وتعقيد 
منتجاتها. فعلى سبيل المثال: تقوم الشركة كلَّ عام بتصنيع مئات الآلاف من اللفائف 
التي تحتوي على بطاقة بها مجموعة متنوعة من أجهزة الاستشعار التي تقوم بقياس 
الإشارات الكهربائية للدم في أثناء عملية الاختبار. 

يقول يونج: ”تتأثر أجهزةٌ الاستشعار هذه بعوامل عديدة جدًاء من التغيرات 
البيئية» مثل: الحرارة والرطوبة إلى عدم تناسق اللواد الواردة؛ لذلك فإننا نقوم وبشكلٍ 
متواصلٍ مراقبة أدائها. إننا نجمعٌ ملايين المُجلات من البياناتء والتي يتم تخزين 
معظمها في قواعد يانات 5۲۷۴۲ .5Q1‏ وكنا في حاجة إلى منصة تحليلية تمكّن فرق 
البحث والتطوير التابعة لنا من الوصول بسرعة إلى تلك البيانات والتدخُل السريع لحل 
Gi‏ مشكلات قد تحدث. وأيصًا؛ ونظرًا لوجود العديد من العوامل في اللعبة؛ فقد احتجنا 
إلى برنامج تلقاني يمكنه مراقبة بيانات الاختبار بذكاء وتنبيهنا إلى المشكلات الطارئة 
بشکل فوري“. 

الحل: 

بدأ معمل الأجهزة بالبحث عن حل تحليايٌ لتلبية احتياجاته. فقامت الشركة سريعاً 
بإزالة معظم الأدوات من السوق؛ لأنها فشلت في تقديم الوظائف الإحصائية ومستوى الثقة 


Wwe‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائيةء تصوير البيانات 


المطلوبة لبيئة الرعاية الصحية. مع ترك اثنين من المنافسين: الأول 5]3]15]18, وحل تحليلي 
آخر وهو 512156162 1611. بالنسبة لمعمل الأجهزة, Statistica sa cu2lsJI 55UJI OI‏ 

يقول يونغ: SYL. 5,8 Statistica jLzel ol»‏ فمع Statistica‏ مكنا من إنشاء 
مجموعة واسعة من تشكيلات التحليل العالية المستوى للبيانات الخاصة بنا؛ وذلك 
ليستخدمها المحلّلون على نطاق المؤسسة بأكملها. والآن؛ عندما يريدون فهم أشياء 
مُحدَّدة؛ يمكنهم ببساطة إجراءٌ تحليل مُعلّب من هذا المتجر المركزي بدلا من الاضطرار 
إلى طلب تقنية المعلومات للوصول dl‏ البيانات أو تذكر كيفية إجراء اختبار معين». 

إضافة إلى ذلك؛ Jal Statistica cats‏ بكثير في الاستخدام والنشر من حلولٍ 
التحليلات القديمة. يُدوّن يونج في ملاحظاته: «لتنفيذ والإبقاء على حلولٍ تحليلية أخرى» 
تحتاج إلى معرفة برمجة حلول التحليلات؛ JLasyl (Sce Statistica x 55Js‏ بالبيانات 
الخاصة بناء وتحليلها ونشرها في غضون ساعة - على الرغم من أنني لست مبرمجًا عظيمًا». 

وأخيرًً؛ بالإضافة إلى وظائفها المُتقدّمة وسهولة استخدامها؛ فقد قدَّمت شركة 
iy Jai Flis $ yau iasg Eble Kes Statistica‏ «إِنَّ الأشخاص الذين 
ساعدونا في تطبيق نظام 568]15]162 كانوا ببساطة رائعين: وكان السعرٌ öl‏ بكثير مما 
يتيحه أي حل آخر للتحليلات». 

النتائج: 

»چ Statistica‏ أصبح الآن لدى ios‏ المشروع القدرة على الوصول السّهل إلى Js‏ 
من البيانات والتحليلات التي يحتاجونها مواصلة كل من الابتكار والجودة في معمل 
الأجهزة. في الواقع؛ فإنَّ التحليلات السريعة والفعًالة وكذلك التحذيراث الآلية من 
åS å åg Statistica öl‏ مئات الآلاف من الدولارات. 

يقول يونج: ”في أثناء تصنيع خرطوشة الحبر؛ نتعرّض من حينٍ لآخر لبعض 
المشكلاتء مثل عدم الدقة في التركيب الكيمياق الذي مر على أحد أجهزة الاستشعارء 
إن تخريد دفعة واحدة من البطاقات قد يكلّفنا مئات الآلاف من الدولارات. غير أنَّ 
151 تساعدنا على اكتشاف الخطأ بسرعة وإصلاحه مما يُجِتّبنا تلك التكاليف. 
فمثلًا؛ يمكننا تزويجٌ بيانات الاختبار مع بيانات سجل تاريخ الأجهزة الإلكترونية من بيئة 
الخاصة بنا وإجراء كل أنواع الارتباطات لتحديد أي التغيّرات يؤدي إلى مشكلة 
من هذه التغيرات مثلًا التغيُّرات في درجة الحرارة والرطوبة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ww‏ 


الفصل الثاني 


wv 


ollas X s‏ التحقق من الجودة اليدوية ذات قيمة كبيرة بكلّ تأكيد؛ ولكن تدير 
151 تلقائياً مجموعةً متنوعةً من التحليلات للشركة.» بشكل يضمن عدم حدوث 
أيّ خطأ واكتشاف المشكلات بسرعة. يقول يونغ: «من المقرّر del‏ العديد من عمليات 
التحليل بشكلٍ دوريّ لفحص أشياء مختلفة؛ فإذا تم اكتشاف مشكلة؛ فسيقوم النظام 
تلقائيًا بتنبيه ا مسؤولين عبر البريد الإلكتروني أو تسجيل المخالفات بقاعدة البيانات». 

إِنَّ بعض المزايا الرئيسية لتحليلات البيانات المتقدّمة مع 5]]15]12 تشتملٌ على ما يلي: 

- الالتزام بالتنظيم: بالإضافة إلى توفير أموالٍ معامل أجهزة القياس؛ تضمّن 
8 كذلك التزامَ عمليات الشركة بقوانين إدارة الأغذية والأدوية (884) فيما 
يتعلّق بالجودة والاتساق. يُوضّح يونج ما يلي: «لأننا نقوم بتصنيع الأجهزة الطبية؛ فإننا 
نخضحٌ لنظام eha! e Statistica Gaels FDA la]‏ عمليات التحقق الإحصائية 
التي تتطلبها إدارة 824 - فعلى سبيل المثال: يمكننا بسهولة إثباتٌ أنَّ مجموعتين من 
المنتجات المصنوعة باستخدام مواد كيميائية مختلفة هي نفسها إحصائيًا». 

- ضمان الاتساق: إِنَّ ترتيبات التحليل الموحّدة في 5]8]15]18 والتي يمكن 
استخدامُها في أثناء أيّ مشروع تضمّن التناسق والجودة في معمل الأجهزة. يقول 
يونج: ”وعند تحليل البيانات يمكنك الحصولٌ على نتائج مختلفة تبعًا للطريقة التي 
تستخدمها في التحليل. فمثلًا قد يستخدم علماءٌ مختلفون أنظمةٌ مختلفةً على البيانات» 
أو لا يقومون بتلخيصها إطلاقًاء عندئذ فسيحصلون جميعًا على نتائج مختلفة: أمّا مع 
ا فنستطيع أن نضمّن أنَّ جميع العلماء في جميع مراحل المشروع يقومون 
بإجراء التحليلات بنفس الطريقةء وبهذا نحصل على نتائج متناسقة.» 

- مراقبة سلسلة التوريد: لا يقوم معم ل الأجهزة بتصنيع البطاقة» وبها أجهزة 
استشعار فحسب؛ بل تقوم بتصنيع الجهاز الطبي بالكاملء وبالتالي فهو يعتمدٌ على 
المورّدين لإمداده بالأجزاء المطلوبة. ولمزيد من ضمان الجودة, تُخطّط الشركة لتوسيع 
نطاق تعاملها مع 5]815]168 لمراقبة سلسلة التوريد. 

- توفير الوقت: بالإضافة إلى توفير الأموال ورفع مستوى الالتزام بالتنظيم ملعمل 
الأجهزة. تعمل شركة 518115618 أيضًا على توفير الوقت الثمين لمهندسي وعلماء الشركة؛ 
مما نهم من التركيز بشكل أكبر على الابتكار والحَدّ من الروتينيات. يدون يونج في 
ملاحظاته: «توفر التنبيهات الاستباقية من 508156168 للمهندسين الكثيرَ من الوقت؟ 
فهم ليسوا بحاجة لتذكر فحص العوامل ا مختلفة طوال الوقت» مثل: نقص الجلوكوز؛ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


فهذا اختبارٌ واحدٌ؛ لكنه يسغرق نصف اليوم. أما في ظل مراقبة 5]8]15]18 لبيانات 
الاختبار لدينا؛ فبإمكان المهندسين التركيرٌ على أمور أخرى؛ لعلمهم بأنه سيصلهم بريدٌ 
إلكتروني إذا أذَى نقصٌ الجلوكوز لأيّ مشكلة». 

الاحتمالات المستقبلية: 

ama Ól‏ أجهزة القياس مُتحمّس جدًا للفرص التي تحقّقَت من خلال الرؤية التي 
يوفرها برنامجٌ التحليلات المتقدّمة من 5]]15]108 في مخازن البيانات الخاصة به. يقول 
يونج: ”باستخدام 5]8115]18؛ يمكنك اكتشافُ جميع أنواع الأفكار المتعلقة ببياناتك» والتي 
قد لا تتمّكّن من العثور عليها. فقد يكون أمامك مكاسبُ مادية خفية؛ لكنك لا تراها لأنك 
ثم تحلل بياناتك كما ينبغي. فباستخدام تلك الأداةء اكتشفنا بعض الأشياء ا مثيرة للاهتمام 
في بياناتنا والتي وفرت لنا مبلعًا كبيا جدًا من امال ونتطلّع إلى إيجاد المزيد منها». 

أسئلة للمناقشة: 

-١‏ ماهي التحدَّيات الرئيسية لشركة الأجهزة الطبية؟ وهل تمّ قيادة السوق 
أو التقنية؟ اشرح. 

Joi go Lo -Y‏ المقترح؟ 

- ما هي النتائج التي تمّ التوصل إليها؟ وما رأيك في العائد الحقيقي للاستثمار (80[1)؟ 


Source: Dell customer case study. Medical device company ensures product quality 
while saving hundreds of thousands of dollars. https://software.dell.com/documents/ 
instrumentation-laboratory-medical-device-companyensures-product-quality- 
whilesaving-hundreds-ofthousands-of-dollars-case-study-80048.pdf (accessed 
August 2016). Used by Permission from Dell. 


أسئلة مراجعة على القسم Y-Y‏ 

-١‏ ما هي البيانات؟ وكيف تختلفٌ البيانات عن المعلومات والمعرفة؟ 

۲- ما هي الفئاث الرئيسية للبيانات؟ ما هي أنواعٌ البيانات التي يمكن استخدامها في ذكاء الأعمال 
والتحليلات؟ 

- هل يمكننا استخدامٌ نفس تمثيل البيانات لجميع نماذج التحليلات؟ لماذا أو لماذا لا؟ 


à 


ع- ما هو تمثيل بيانات -١‏ من - ن؟ اذا وأين يتم استخدامها في التحليلات؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wr‏ 


الفصل الثاني 


٤-۲‏ فن وعلم معالجة البيانات: 

عادةً ما تكون البيانات في شكلها الأصلي (أَيّ: بيانات العام الحقيقي) ليست جاهزةً للاستخدام 
ف مهام التحليلات. فغالبًا ما تكون كثيرة الأخطاء ومنحرفةً ومُعقدةً للغاية. وغير دقيقة؛ لذا فإنه 
من الضروري القيامٌ هنا بعملية شاقة ومُكلّفة من ناحية الوقت (تُسمّى عملية المعالجة المسبقة 
للبيانات) بغرض تحويل بيانات العالم الحقيقي إلى شكل جيد الدقة لاستخدامها في خوارزميات 
التحليلات )2006 XKotstants, Kanellopoulos, & Pintelas,‏ ويقرٌ العديدٌ من مُحترفي 
التحليلات أنَّ الوقت المُستَغْرّق في معالجة البيانات (والذي قد يكون أقلّ مراحل العملية امتاعًا) 
يكون أطول بكثير من الوقت المُستَغْرّق في بقية مهامٌ التحليلات (متعة بناء نموذج التحليلات 
وتقيبمها). ويوضّح الشكل 8-7 الخطوات الرئيسية في محاولة معالجة البيانات. 

في المرحلة الأولى من المعالجة المُسبّقة للبيانات؛ يتح جمعٌ البيانات المتعلّقة بالدراسة من 
المصادر المحدّدة لذلك ويتخُ تحديدٌ السجلات والمتغيرات الضرورية (استنادًا على الفهم العميق 
للبيانات» مع تصفية المعلومات غير الضرورية)» كما يتم تكامل/ دَمْج السّجلات الواردة من 
بيانات متعددة المصادر (وأيضًا باستخدام الفهم العميق للبيانات يكن التعامل مع المرادفات 
والمتضادات المتشابهة بشكلٍ صحيح). 

في المرحلة الثانية من معالجة البيانات؛ يتم تنظيف البيانات (تُعرّف هذه الخطوة أيضاً 
ب تنقية البيانات). فعادةً ما تكون البيانات في شكلها الأصلي/ الخام/ الحقيقي كثيرة الأخطاء 
s Stolfo, Kim; 19985 Hernández)‏ ,09« ۲۰۰۴). في هذه الخطوة؛ oues e»‏ القيم في 
مجموعة البيانات والتعامل معها. في بعض الحالات؛ تش كل القيمُ المفقودة شذوذاً في مجموعة 
البيانات» وفي هذه الحالة لابدٌ من حصرها (بوَضْع قيم محتملة لها) أو تجاهلهاء وفي حالات 
أخرى؛ تكون القيمٌ المفقودة جزءًا طبيعيًًا من مجموعة البيانات (فمثلاه غالبًا ما يتح ترك خانة 
دخل الأسرة بدون إجابة من أصحاب الدخل المرتفع). في هذه الخطوة؛ يجب أيضًا على المحلّل 
تحديدٌ القيم الصاخبة في البيانات (أيْ: القيم المتطرفة) ومن ثم تسهيلها. بالإضافة إلى ذلك؛ يجب 
التعامل مع حالات عدم الاتساق في البيانات (كوجود قيم غير عادية ضمن متغير) باستخدام 
معرفة مجال الدراسة و/ أو رأي الخبير. 

في ال مرحلة الثالثة من معالجة البيانات؛ يتم تحويل البيانات من أجل معالجة أفضل. فعلى 
سبيل ال مثال: في العديد من الحالات» يتم توزيعٌ البيانات توزيعًا طبيعيًا بين حَذَّين (أدنى وأقصى) 
مُحدّدين؛ وذلك لجميع المتغبرات؛ بهدف تخفيف التحيّز المحتمل sil‏ واحدٍ (به قيّم عددية 


Wwe‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


كبيرة. مثل دخل الأسرة) يحتوي على متغيرات أخرى (لها قِيمٌ أصغرء مثل عدد مَنْ يعول أو 
سنوات الخدم ة) والتي قد تكون أكثر أهميةً. وهناك تحويلٌ آخر يتم إجراؤه وهو التفريد و/ 
أو التجميع. وفي بعض الحالات؛ يتم تحويلٌ المتغيرات الرقمية إلى قيم فئوية (مثل: منخفض - 
متوسط - مرتفع)» وفي حالات أخرى؛ LS es‏ النطاق الفريد لقيمة المتغير الاسمي إلى مجموعة 
أصغر باستخدام مفهوم التسلسل الهرمي (على سبيل المثال: عند استخدام حالات فردية تحتوي 
على 0٠‏ قيمة مختلفة» قد يستخدمٌ المحلّل عِدَّة مناطق لمتغير يُظهر الموقع)؛ وذلك للحصول على 
مجموعة بيانات تكون أكثر قابليةَ للتعامل مع الحاسب. ومع ذلك؛ ففي حالاتٍ أخرى؛ قد يختار 
المحلّل إنشاء متغيرات جديدة تعتمدٌ على المتغيرات الحالية لزيادة معنوية المعلومات الموجودة 
بمجموعة المتغيرات في حزمة البيانات. 





t 
t 


f | 
£ 








شکل ۳-۲: خطوات معالجة البيانات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wo‏ 


الفصل الثاني 


فعلى سبيل المثال: في مجموعة البيانات الخاصة بزراعة الأعضاءء قد يختارٌ المحلل استخداءً 
متغير مفرد يوضّح حالة الدم Sas (1 2 match, 0 - no-match)‏ من استخدام قيم منفصلة 
متعددة الصور لنوع الفصيلة لدى US‏ من المتبرع والمتلقي. وقد يؤدي هذا التبسيط إلى زيادة 
محتوى المعلومات مع تقليل تعقيد العلاقات في البيانات. 


أمّا المرحلةٌ النهائية من معالجة البيانات الأوِّية فهي تقليل البيانات. وعلى الرغم من أن 
علماء البيانات (أيْ: محترفو التحليلات) يحبُون الحصول على مجموعات كبيرة من البيانات؛ فإنَّ 
البيانات الزائدة قد تكون أيضًا مشكلة. بمعنى أبسط؛ يمكن للمحلّل أن يتصور البيانات الشائعة 
الاستخدام في مشاريع التحليلات التنبؤية كملفٍ ثابت يتكوّن من بُعدّين: المتغيرات (عدد 
الأعمدة) والحالات/ السجلات (عدد الصفوف). في بعض الحالات (كمعالجة الصور ومشاريع 
(52s microarray cL 5U gs genome‏ کن أن يكون عد المتغيرات (التي تم تمثيلها 
بالأعمدة) كبيرا نسبيًاء ويجب على المحلّل تقليل العدد إلى حجم يسهل التحكّم فيه. تُسمَّى 
هذه العملية عادة تخفيض الأبعاد (أو انتقاء المتغير)؛ وذلك لأنّ المتغيرات تت معالجتها كأبعاد 
مختلفة تصف ظاهرةً من منظورات مختلفةء في التحليلات التنبؤية والتنقيب في البيانات. وعلى 
الرغم من عدم وجود طريقة واحدة مُثلى لإنجاز هذه المهمة؛ فإنه يمكن للمحلل استخدامٌ نتائج 
سابقة النشرء واستشارة خبراء المجال محل الدراسة:» وإجراء اختبارات إحصائية مناسبة (مثل: 
تحليل المكوّنات الأساسية أو تحليل المكوّنات المستقلة).: والأكثر تفضيلًا هو استخدام مزيج من 
هذه التقنيات لتقليل أبعاد البيانات بنجاح إلى مجموعة فرعية أكثر قابليةٌ للإدارة وأكثر ملاءمةً. 


وفيما يتعلّق بالبُعْد الآخر (أيْ: عدد الحالات والتي يتم مثيلها في الصفوف)؛ قد تتضمّن 
بعضٌ خم البيانات ملايين أو مليارات من السّجلات. وعلى الرغم من ازدياد قوة الحوسبة بصورة 
مضاعفة؛ فإنَّ معالجة مثل هذا العدد الكبير من السجلات قد لا يكون Jis ds Saa sl las‏ 
هذه الحالات؛ قد نحتاج إلى تحليل عينة عبارة عن حزمة فرعية من البيانات. Ads‏ الافتراض 
الأماسي لأخذ العينات هو أنَّ المجموعة الفرعية من البيانات سوف تحتوي على جميع الأنماط 
المتعلقة بمجموعة البيانات الكاملة. يجب أن يكون ال محلل شديد الحذر عند اختياره للمجموعة 
الفرعية من البيانات» والتي يجبُ أن تعكس جوهر مجموعة البيانات الكاملة وليست خاصةً 
بمجموعة فرعية أو فئة فرعية. ويتمٌ فرزُ البيانات عادةً على بعض المتغيّرات» وقد يقودنا أخذٌ 
sj‏ من أعلى البيانات أو أسغلها إلى بيانات مُتحيّزة لقيم مُحدَّدة من المتغير المفهرس؛ لذلك 
حاول دايا اختيار الس جلات الموجودة في مجموعة العينات بشكلٍ عشوائي. وبالنسبة للبيانات 


wa‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


ا منحرفةء قد لا يكون أذ عيناتِ عشوائية بصورة مباشرة كافيّا؛ بل قد يكون الأفضلٌ هو أخذ عينة 
طبقية (أيْ: إجراء تمثيل نسبي لمجموعاتٍ فرعية مختلفة من البيانات المتاحة ضمن مجموعة 
بيانات العينة). وعند التعامل مع البيانات المنحرفة فحريٌّ بنا تحقيق التوازن بين البيانات 
شديدة الانحراف؛ إما من خلال الإفراط أو التقصير في تمثيل الفئات الأكثر تمثيلًا. وقد أظهرت 
الأبحاثٌ أنَّ مجموعات البيانات المتوازنة تميل إلى إنتاج نماذج تنبؤ أفضل من النماذج غير المتوازنة 
(gY V 55,515 Thammasiri)‏ 


يتم تلخيص جوهر معالجة البيانات في الجدول 1-1 الذي يرسم المراحل الرئيسة (جنبًا إلى 
جنب مع أو صاف مشكلاتها) إلى قائمة تمثيلية للمهامّ والخوارزميات. 

يكاد يكون من المستحيل التقليل من قيمة اقتراح معالجة البيانات. وهي واحدةٌ من تلك 
الأنشطة التي تتطلب وقثًا طويلًا؛ حيث يؤق الاستثمار في الوقت والجهد ثمارًا هائلة تغطي على 
تناقص العائدات. وهذا يعني أنه كلما زادت الموارد التي تستثمر فيها؛ زادت الأرباح في النهاية. 
توح الحالة العملية ۲-۲ دراسة مثيرةً للاهتمام؛ إذ يتم استخدام البيانات الأكاديمية الخام 
والمتاحة بسهولة داخل منظمة تعليمية لتطوير نماذج تنبؤية لفهم تسرب الطلاب اممبتدئينء 
وتحسين استبقاء الطلاب الجدد في مؤسسة التعليم العالي الكبيرة. بناءَ على ما هو مُوضّح في 
الحالة العملية؛ فإنَّ كلّ مهمة من عمليات معالجة البيانات الموضّحة في الجدول 1-7 كانت مهمة 
للتنفيذ الناجح لمشروع التحليلات الأساسية» لا سيما المهمة المتعلقة بموازنة مجموعة البيانات. 

جدول ١1-8‏ : ملخص لهام معالجة البيانات» والأساليب المحتملة 
المهمة الرئيسية المهام الفرعية الطرق الشائعة 
- الوصول للبيانات وجمعها. |- استعلامات :50[1: وكلاء البرامج» خدمات 
- اختيار وتنقية البيانات. الويب. 
- تكامل وتوحيد البيانات. - الخبرة في المجالء استعلامات 8Q1‏ 
توحيد البيانات الاختبارات الإحصائية. 
SQL cols Lal -‏ وخبرة المجالء وتصنيف 
البيانات المعتمدة على علم الأنتولوجي. 











ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wv‏ 














الفصل الثاني 


المهمة الرئيسية 


تنظيف البيانات 


تحويل البيانات 





WA 





المهام الفرعية 


- التعامل مع القيم المفقودة في 
البيانات. 


تحديد وتقليل الضوضاء في 
البيانات. 


إيجاد. وإزالة البيانات الخطأ. 


توزيع البيانات طبيعيًا. 


فصل أو تجميع البيانات. 





الطرق الشائعة 


- ملء القيم المفقودة (الانحرافات) مع القيم 


الأكثر ملاءمةً (الوسيطء الوسط الحسابي» 
adl‏ الأدنى/ الحدٌّ الأقصىء المنوال... إلخ). 


5L] -‏ قيمةٍ ثابتة مثل ”:2/1" للقيم المفقودة؛ 


إزالة سجل القيمة المفقودة؛ عدم فعل أي شيء. 


- تحديد القيم المتطرفة في البيانات 


باستخدام تقنيات إحصائية بسيطة (مثل: 
المتوسطات. والانحرافات المعيارية) أو 
بالتحليل العنقودي؛ أو بمجرد تحديدها 
نقوم بإزالة القيم المتطرفة أو تسهيلها 
باستخدام الثنائيات أو الانحدار أو 
المتوسطات البسيطة. 


- تحديد القيم الخطأ في البيانات (بخلاف 


القيم المتطرفة). مثل: القيم الفردية, 
تصنيفات الفئات غير المتسقة. التوزيعات 
الفردية؛ وبمجرد تحديدهاء استخدم 
خبرات المجال لتصحيح القيم الخطأ. أو 
إزالة السجلات المشتملة على Aa e‏ 


- تقليل نطاق القيم في كلّ متغبر ذي قيمة رقمية 


إلى نطاق معياري (على سبيل المثال: ٠‏ إلى ١‏ 
أو ٠‏ إلى )١+‏ باستخدام مجموعة متنوعة من 
تقنيات التورزيع الطبيعي أو القياس. 


- إذا لزم الأمر؛ نقوم بتحويل المتغيرات الرقمية 


إلى تمقيلات منفصلة باستخدام تقنيات 
متعلقة بنطاق أو تكرار المتغيرات الفئوية, 
والحَدٌ من عدد القيم من خلال تطبيق 
التسلسل الهرمي للمفاهيم السليمة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


























التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائية. تصوير البيانات 


المهمة الرئيسية ا مهام الفرعية الطرق الشائعة 
بناء سمات جديدة. - استنباط مُتغيرات جديدة وذات معلومات 
أكثر من المتغيّرات الموجودة بالفعل باستخدام 
مجموعة واسعة من الدوال الرياضية (بسيطة 
مثل الجمع والضرب» أو معقدة مثل مزيج 
مختلط من تحؤلات السجل). 


تقليل عدد السّمات. - تحليل المكون الرئيسيء تحليل مكوّن 

تقليل المعلومات مستقلء اختبار 1-5011856اء: ddos‏ 
الارتباطء واستقراء شجرة القرارات. 

تقليل عدد السّجلات. سحب عشوفئي للعينات. سحب طبقي 


للعينات. سحب متأن للعينات باستخدام 
الخبرة والمعرفة السابقة. 
توازن البيانات المنحرفة. استخلص أقلَّ تمثيل أو تمثيل الفئات الأكثر تمثيلًا 














حالة عملية ۲-۲ 
تحسين الاحتفاظ بالطلاب باستخدام التحليلات المعتمدة على البيانات 

أصبحت ظاهرةٌ تسرب الطلاب واحدةً من أكثر التحَدّيات التي تواجه صانعي 
القرار في المؤسسات الأكاديمية. فعلى الرّغم من كل البرامج والخدمات التي تمّ وضعها 
للمساعدة في الاحتفاظ بالطلاب؛ وفقًا لوزارة التعليم الأمريكية ومركز الإحصائيات 
التعليمية (2665.60.807)؛ فلا يحصل على درجة البكالوريوس أكثر من نصف الذين 
يلتحقون بالتعليم العالي. أصبحت إدارة التسجيل والإبقاء على الطلاب Ío‏ قصوى 
ديري الكليات والجامعات في الولايات المتحدة وبلدان أخرى حول العام. فعادةً ما 
يؤدي التسرّب الكبير للطلاب إلى خسارة مالية عامة» وانخفاض معدلات التخرّج: وسمعة 
في نظر جميع أصحاب المصلحة. إذ يبحث JS‏ من المشرّعين وصانعي 
السياسات الذين يشرفون على التعليم العالي ويُخصُصون له امموازات التقديريةء وكذلك 
الآباءٌ الذين يدفعون تكاليف تعليم أبنائهم؛ بغرض إعدادهم لمستقبل أفضلء وأيضًا 
اللاي الذي كعارون التحقصات :الجائعية - ns‏ كل هولاه - عن أذلةعان العؤدة 

المؤسسية والسّمعة لتوجيه عمليات صُنع القرار الخاصة بهم. 





تربوية أدذ 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wa‏ 




















الفصل الثاني 


الحل المقترّح: 

لتحسين الاحتفاظ بالطلاب؛ يجب على المحلّل أولاً أن يحاول فهم الأسباب غير 
الواهية وراء التسرّب من التعليم. ولي ننجح في ذلك؛ علينا أولًا أن نحَذّد وبدقة 
الطلاب الذين يُداهمهم خطر التسرّب. حتى الآن؛ تمّ تكريس الغالبية العظمى من 
بحوث استنزاف الطلاب لفهم هذه الظاهرة الاجتماعية المعقدة والحاسمة في نفس 
الوقت. وعلى الرّغم من أن هذه الدراسات النوعية والسّلوكية والاستقصائية كشفت 
عن رؤية ثمينة للغاية من خلال تطوير واختبار مجموعة واسعة من النظريات؛ فإنها 
لا توفر الآلية اللازمة للتنبق الدقيق (والتطؤر المحتمل) لتسرِّب الطلاب. قدَّم المشروع 
ا مختصر في دراسة هذه الحالة نهجًا بحثيًا كميًا؛ إذ يمكن استخدام البيانات المؤسسية 
التاريخية من قواعد بيانات الطلاب لتطوير نماذج قادرة على التنبؤ بالإضافة إلى توضيح 
طبيعة المؤسسة الخاصة بمشكلة التسرّب. ويوضُح الشكل 6-7 منهج التحليلات المقترح. 

وعلى الرغم من كون المفهوم جديداً نسبيًا على التعليم العالي لأكثر من عقد من 
الزمان؛ فقد تت دراسة مشكلات مماثلة في مجال إدارة التسويق باستخدام تقنيات 
تحليلات البيانات التنبؤية تحت اسم «churn analysis»‏ بغرض الإجابة عن السؤال 
التالي: «مّن من عملائنا الحاليين أكثر ميلاً للتوقف عن شراء منتجاتنا أو خدماتنا؟» 
بحيث يمكن إجراء نوع من عمليات الوساطة أو التدخل للإبقاء عليهم؛ إذ يُعَدُ 
الاحتفاظ بالعملاء الحاليين أمراً بالغ الأهمية؛ لأننا وكما نعلم جميعًاء وكما أظهرت 
البحوث اممتعلقة مرارًا وتکرارًاء آن تکالیف وجهد ووقت گشب عمیل جدید آکٹر بقدرٍ 
كبيرٍ من محاولة الحفاظ على العميل الموجود بالفعل. 

البيانات من الجوهر: 

جاءت بيانات هذا ا مشروع البحثي من مؤسسة واحدة (وهي جامعة عامة شاملة 
تقع في منطقة الغرب الأوسط بالولايات المتحدة) بمتوسط تسجيلٍ يبلغ !".٠٠‏ طالب» 
منهم حوالي ۸٠۰‏ من الم مقيمين في نفس الولايةء وحوالي 19* منهم من الأقليات. لا يُوجَد 
فرق معنوي بين الجنسين في أرقام التسجيل. كان متوسط نسبة الاحتفاظ بالطلاب 
الجّدد في المؤسسة حوالي :2/١‏ ومتوسط نسبة التخرّج لمدة " سنوات XV dise‏ 

استخدمت الدراسة © سنوات من البيانات المؤسسية» والتي شملت أكثر من ٠٠٠٠١‏ 
طالب مُسجلين كطلاب جُدُّد. تمّ جمعهم من قواعد بيانات مختلفة ومتنوعة للطلاب 
الجامعيين. وقد تضمّتَت البياناتٌ المتغيرات المتعلقة بالخصائص الأكادهية وامالية 


Ww‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


والتوزيع السكافي للطلاب. وبعد دمج وتحويل البيانات المتعددة الأبعاد لكلّ طالب إلى 
ملف مُسطّح واحد (أَيْ: ملف يحتوي على أعمدة تمثّل المتغيرات وصفوف تمثل سجلات 
الطالب)ء تم CALL ea‏ الناتج ومعالجته مسبقاً لتحديد ومعالجة القيم الشاذة وغير 
القابلة للاستخدام. فعلى سبيل المثال: قامت الدراسة بإزالة كل سجلات الطلاب الدوليين 
من حزمة البيانات؛ لأنها لم تحتو على معلومات عن بعض المتنبئين ذوي السّمعة الطيبة 
(مثل: المدرسة الثانوية «GPA‏ ودرجات '541). في مرحلة تحويل البيانات؛ تم تجميعٌ 

بعض المتغيرات: (فمثلاً: يتم تجميع المتغيرات ”الرئيسية“ و”الكثيفة“ إلى متغيرات 
pe (ConcentrattonSpecified s MajorDeclared à id‏ على تفسير أفضل 
للنمذجة التنبؤية. بالإضافة إلى ذلك؛ تمّ استخدام بعض المتغيرات لاشتقاق متغيرات 
جديدة (مثل: نسبة المكتسب/ ال مسجل وسنوات ما بعد ا مدرسة الثانوية). 


CET TOE اا يا‎ 









الإتحدار اللو جيستى 














شكل !-4: منهج التحليلات للتنبؤ بتسرّب الطلاب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wi‏ 























الفصل الثاني 


المكتسبة/ المسجلة - الساعات المكتسبة/ الساعات المسجلة 
سنوات ما بعد المدرسة الثانوية = سنة تسجيل في الجامعة - سنة التخرّج من المدرسة الثانوية 

تمّ إنشاء النسبة المكتسبة/ المسجّلة؛ للحصول على تمثيلٍ أفضل لمرونة الطلاب 
وتقريرهم في الفصل الدرامي الأول من السنة الدراسية الأول في الجامعة. وبشكلٍ 
منطقي؛ فإنه من المتوقع أن تؤثر القيم الأكبر لهذا المتغير بشكلٍ إيجابي على 
الاستبقاء/ الثبات. تمّ إنشاء مصطلح سنوات ما بعد المدرسة الثانوية لقياس 
تأثير الوقت الممستغرّق بين التخرّج من المدرسة الثانوية والتسجيل الأوَّلي بالكلية. 
ومنطقيًا؛ فمن المتوقع أن يُسهم هذا المتغيّر في التنبؤ بتسرّب الطلاب. يتم تحديدٌ 
هذه المجموعات والمتغيّرات المشتقة بناءَ على عدد من التجارب التي تمّ إجراؤها 
لعدد من الفرضيات المنطقية. وتم حفظ هذه التجارب والفرضيات في حزمة 
امتغير النهاني» وهي التي رفعت مستوى الحساسية وأيضًا أَذّت إلى الوصول إلى 
مستوى أفضل من دقة التنبؤ. تعكس الطبيعة الحقيقية للسكان (أيْ: الطلاب 
الجدد)؛ والمتغير التابع )“Second Fall Registered” xe‏ والذي احتوی ule‏ 
الکثیر من سجلات نعم (~ ۸۰) وسجلات لا (~ ۲۰ انظر: الشكل 6-9). 

تظهر البحوث أن وجود مثل هذه البيانات غير المتوازنة يؤثر سلبيًا على أداء 
النموذج. ولذلك؛ جرّبت الدراسة خيارات استخدام ومقارنة نتائج نفس النوع 
من النماذج التي تمَّ بناؤها مع البيانات الأصلية غير المتوازنة (متحيّزة السجلات 
نعم) والبيانات المتوازنة جيدًا. 
النمذجة والتقييم: 

قامت الدراسة باستخدام أربع طرق تصنيف شائعة الاستخدام (أيْ: الشبكات 
العصبية الاصطناعية. وشجرات القرارء وآلة المتجهات الداعمة:. والانحدار 
اللوجستي) جنباً إلى جنب مع ثلاثة أطقم من تقنيات المجموعات النموذجية 
(أيْ: تعبكةوفصل» وذمج المعلومات): :ثم قت بعد ذلك.مقارنة الننائج التي تم 
الحصول عليها من جميع أنواع النماذج بعضها مع بعض باستخدام طرق تقييم 
نموذج التصنيف المنتظم (مثل: الدقة التنبؤية الشاملة: الحساسية» النوعية) على 
عيّنات التحمّل. 


wr‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائيةء تصوير البيانات 


I‏ تقييم النموذج بناء النموذج والإختبار 
2 دقة) وإختيار الصلاحية 


ED c 10096, 50%) 


Prop m 
) 


5 / 
ور‎ W.E. 
z> Bb e rm nS 


نعم : ترك الدراسة.لا: مستمر قى fal jl‏ 


| بيانات غير موزونة 


بيانات موزونة 





























شكل 0-8: تصوير بياني لمشكلة عدم توازن الفئات 
في خوارزميات تعلُم الآلة (والتي سيم تغطية بعض منها في الفصل »)٤‏ 
alos dad‏ الحساسية طريقة لتحديد علاقة *السبب. والتفيحة؟ CM cgo‏ 
ومُخرجات نموذج التنبؤ المعطى. وَتَّعَدٌ الفكرة الأساسية وراء تحليل الحساسية أنه 
يقيس أهمية متغيرات التوقع على أساس التغيير في أداء النمذجة الذي يحدث إذا 
لم يتم تضمين متغير توقع في النموذج. ويُطلّق على ممارسة النمذجة والتجارب 
هذه أيضًا مصطلح (255551261 16316-0126-0104 3). ومن ثم؛ فإن مقياس 
حساسية متغير تنبؤ مُحدَّد هو نسبة الخطأ في النموذج المدرّب بدون متغير 
التنبِؤ إلى خطأ النموذج الذي يتضمن متغير المتنبئ هذا. وكلما كانت الشبكة 
أكثر حساسية لمتغير معين» زاد انخفاص الأداء في غياب هذا ا متغيرء ومن ثم زادت 
نسبة الأهمية. وبالإضافة إلى القوة التنبؤية للنماذج؛ فقد أجرت الدراسة أيضًا 
تحليلات الحساسية لتحديد الأهمية النسبية لمتغيرات الإدخال. 
النتائج: 
في المجموعة الأولى من التجارب. استخدمت الدراسة مجموعة البيانات 
الأصلية غير المتوازنة. واستنادًا إلى نتائج تقدير الصلاحية المتقاطع ذي ال 
٠‏ مراحل فقد أنتجت خوارزمية آلة المتجهات الداعمة (517781) أفضل دقة 
معدل تنبؤ إجمالي يبلغ ۸۷,۲١‏ وجاءت شجرة القرار في المركز الثاني بمعدّل تنبؤ 
إجمالي قدره AV, VT‏ تليها الشبكات العصبية الاصطناعية بمعدل تنبؤ إجمالي 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wr‏ 

















الفصل الثاني 


we 


6 ثم الانحدار اللوجستي معدل تنب إجمالي قدره ۸1,١١‏ (انظر: الجدول 
7-7). ويكشف الفحص الدقيق لهذه النتائج أنَّ دقة التنبو لفئة ”نعم“ أعلى 
بشكل معنوي من دقة التنبؤ للفئة ”لا“. في الواقع؛ تنبأت جميع أنواع النماذج 
الأربعة بالطلاب الذين يرجح عودتهم للسنة الثانية بدقة تبلغ >٠‏ لكنها (أيّ: 
النماذج) تنبأت بالطلاب المحتمل أن ينقطعوا عن الدراسة بعد عام دراسي جديد 
بمستوى دقة لايصل إلى .:0٠‏ ولأن التنبق بفئة ”لا“ هو الهدف الرئيسي من هذه 
الدراسة؛ فإن دقة أقل من :0٠‏ لهذه الفئة تُكَنٌّ غير مقبولة. ومن الممكن (بل 
من الواجب) أن يُعرّى مثل هذا الاختلاف في دقة التنبؤ للفئتين إلى الطبيعة غير 
المتوازنة لمجموعة البيانات التدريبية (أي: ~ ۸٠‏ ”نعم“ و~ XY*‏ "79 

TABLE 22 Prediction results for the Original/unbalanced Data set 
ANNI) eet (ojus Aue cef rm 

No Yes No Yes No Yes No Yes 


No 1494 384 1518 304 1478 255 1438 376 
Yes 1596 — 11142 1572 11222 1612 M271 1652 11150 


SUM 3090 11526 3090 11526 3090 11526 — 3090 — 11526 
PeClass Accuracy 4835% — 86074 — 49124 — 9/364 — 47834 9779% — 4654 — 96745 
Overall Accuracy. 8645% 8716% 8723% 86.12% 





استخدمت الجولة التالية من التجارب مجموعة بيانات متوازنة؛ إذ يتم تمثيل الفثتين 
بالتساوي تقريباً. وف سبيل تحقيق هذا الأسلوب؛ أخذت الدراسة جميع العينات من 
فئة الأقلية (أيْ: الطبقة «لا») واختارت عشوائياً عدداً متساوياً من العينات من طبقة 
الأغلبية (أيْ: الطبقة «نعم») وتم تكرارٌ هذه العملية ٠١‏ مرات لتقليل التحيّز المحتمل 
coL iles a las (S colis ilg and] dall‏ أخلالعينات هذه عن مجموعة 
بيانات تضم ما يزيد عن ٠٠٠٠١‏ سجلء والتي تم فيها تمثيلُ كلا الفئتين («نعم» و«لا») 
بالتساوي تمامًا. مرةً أخرى. وباستخدام منهجية تقدير الصلاحية ذي ال ٠١‏ مراحل؛ 
قامت الدراسة بتطوير واختبار تماذج تنبؤ لجميع أنواع النماذج الأربعة. ويبَيّن الجدول 
Y-Y‏ نتائج هذه التجارب. وبناءً على نتائج العينة المتحمّل عليها من قبل؛ قامت آلة 
المتجهات الداعمة bya‏ أخرى بإفراز أفضل معدل دقة للتنبق بشكل عام بنسبة ۸1,۱۸ 
متبوعة بأشجار القرا. والشبكات العصبية الاصطناعية» والانحدار اللوجستي بمعدلات 
دقة تنبؤ عامة تبلغ 4۸۰,1٥‏ و1/9,80/, de AVE, YT‏ الترتيب. وكما يتضح من معدلات 
الدقة لكلّ فئة؛ فإن نماذج التنبؤ كانت أفضل بشكلٍ معنوي في التنبؤ بفئة ”لا“ باستخدام 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


البيانات المتوازنة مقارنةٌ بها عند استخدام البيانات غير المتوازنة. وبشكل عام؛ كانت 
تقنيات تعلّم الآلة الثلاثة أفضل بكثير من نظيرتها الإحصائية الانحدار اللوجستي. 


TABLE 23 Prediction results for the balanced Data set 
Confusion ANNIMLP) DT(C5) SWM LR 
Matrix No Ys No Ys No Ys No Ys 
No 2309 464 2311 AT 2313 386 2125 626 
Yes 781 2626 79 2673 T" 2104 965 2464 
SUM 3090 3090 3090 3090 3090 3090 3090 3090 
Perclass Accuracy nm 8498% 7479% 8650% 7485% 8151% 6877 7914% 
Overall Accuracy 7985% 80.65% 81.18% 1426% 





è g 


بعد ذلك؛ thal g‏ مجموعة أخرى من التجارب لتقدير القدرة التنبؤية للنماذج 
الثلاثة. واستنادًا إلى نتائج تقدير الصلاحية المتقاطع ذي ال ٠١‏ أجزاء» أنتج نموذج مجموعة 
اندماج اممعلومات أفضل النتائج معدل تنب إجمالي يبلغ ۸۲,٠۰‏ ثم مجموعات من 
نوع التعبئة ومجموعات من نوع الدّعم بمعدلات تنبؤ إجمالية تبلغ 2۸1,۸۰ و ۸٠,١١‏ 
على التوالي (انظر: الجدول 6-7). وعلى الرغم من أن نتائج التنبؤات أفضل إلى حَدَّ ما من 
النماذج الفردية؛ فإنه من امعروف أن مجموعات النماذج تنتج أنظمة تنبؤ Šilu ASİ‏ 
مقارنةٌ بنموذج التنبؤ الأحادي (وسيتم توضيح ذلك بمزيدٍ من التفصيل في الفصل 6). 





TABLE24 Prediction results for thethree ensemble Models 
Boosting Bagging Information Fusion 
(Boosted Trees) (Random Forest) (Weighted Average) 
No Yes No Yes No Yes 

No 2242 375 2327 362 2335 351 
Yes 848 2715 763 2728 755 2739 
SUM 3090 3090 3090 3090 3090 3090 
FerClass Accuracy 72.56% 87.86% 7531% 8828% 7557% 88.64% 

Overall Accuracy 8021% DELI 8210% 


إضافةً إلى تقدير دقة التنبؤ لكل نوع من أنواع النماذج؛ & إجراءُ تحليل الحساسية أيضًا 
باستخدام نماذج التنبق المطوّرة لتحديد الأهمية النسبية للمتغيرات المستقلة (أيْ: المتنبئين). 
ولتحقيق نتائج تحليل الحساسية الشاملة؛ أنتج كل نوع من أنواع النماذج الفردية الأربعة 
مقاييس حساسية خاصة به؛ بحيث تعمل على تصنيف جميع المتغيرات المستقلة في قائمة مرتبة 
بالأولوية. وكما هو متوقع؛ فقد ÍS jèl‏ نوع من أنواع النماذج مراتب حساسية متفاوتة نوعًا 
ما من المتغيرات المستقلة. وبعد جَمْع ÍS‏ المجموعات الأربع من أرقام الحساسية؛ يتم توزيع 
أرقام الحساسية تلك توزيعًا طبيعيًا وتجميعها ورسمها في شكلٍ بياني أفقي (كما بالشكل .)١-۲‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wo‏ 









































الفصل الثاني 


الاستنتاجات: 


أظهرت الدراسة أن وجود بيانات كافية بمتغيّرات ملائمة يقود إلى أساليب استخراج 
بيانات لديها القدرة على التنبؤ بنسبة تسرب الطلاب الجُدد بدقة تصل إلى ۸۰ تقريبًا. 
كما أظهرت النتائج أنه. وبغض النظر عن نموذج التنبؤ ا مستخدم؛ فإن مجموعة البيانات 
المتوازنة (مقارنة بمجموعة البيانات غير المتوازنة/ الأصلية) أنتجت نماذج أفضل في التنبؤ 
بالطلاب الذين من المرجّح تسرّبهم من الكلية قبل سنتهم الدراسية الثانية. ومن بين نماذج 
التنبؤات الفردية الأربعة الس dade‏ في هذه الدراسة: كان أداء آلة المتجهات الداعمة 
هو الأفضلء تليها أشجار القرار. ثم الشبكات العصبية» وأخيرًا الانحدار اللوجستي. UL‏ 
من زاوية سهولة الاستخدام؛ فعلى الرغم من حقيقة أن آلة المتجهات الداعمة أظهرت 
نتائج أفضل للتنبؤ؛ فإنَّ القائم بالتحليل قد يختار استخدام أشجار القرار؛ لأنها بالمقارنة 
مع آلة المتجهات الداعمة والشبكات العصبية؛ فهي تصوّر هيكل نموذج أكثر شفافية. 
أيضًا تظهر أشجار القرار بشكلٍ واضح عملية استنتاج التنبؤات المختلفة؛ مما يوفر تبريرًا 
منطقيًا لنتائج معينةء في حين أن آلات ناقلات الدعم والشبكات العصبية الاصطناعية ما 
هي إلا نماذج رياضية لا تقدّم رؤية شفافة حول «كيف يفعلون ما يفعلون؟». 

أسئلة للمناقشة: 

-١‏ ما هو تسرب الطلاب» وماذا يُحَد مشكلة مهمة في التعليم العالي؟ 

'- ماذا كانت الطرق التقليدية للتعامل مع مشكلة تسرب الطلاب؟ 

- قم بِسَرْد ومناقشة التحَدّيات المتعلقة بالبيانات في سياق دراسة هذه الحالة. 

6- ماذا كان الحلٌّ المقترح؟ وماذا كانت النتائج؟ 
Sources: Thammasiri, D., Delen, D., Meesad, P, & Kasap N. (2014). A critical‏ 
assessment of imbalanced class distribution problem: The case of predicting‏ 
freshmen student attrition. Expert Systems with Applications, 41(2), 321330-; Delen,‏ 
D. (2011). Predicting student attrition with data mining methods. Journal of College‏ 
Student Retention, 13(1), 1735-; Delen, D. (2010). A compara- tive analysis of‏ 


machine learning techniques for student retention management. Decision Support 


Systems, 49(4), 498506-. 


w^‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصقية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


أسئلة مراجعة على القسم :٤-۲‏ 
-١‏ اذا لا تكون البيانات الأصلية/ الخام قابلة للاستخدام بسهولة؛ من خلال مهام التحليلات؟ 
"- ما الخطوات الرئيسية لمعالجة البيانات؟ 
lo -Y‏ المقصود ب تنظيف/ تنقية البيانات؟ وما الأنشطة التي يتم القيام بها في هذه المرحلة؟ 
ISU -£‏ نحتاج إلى تحويل البيانات؟ وما هي مهام تحويل البيانات شائعة الاستخدام؟ 
-٥‏ هكن تخفيض البيانات على الصفوف (أخذ العينات) و/ أو الأعمدة (اختيار متغير). أيهما أكثر تحديًا. 
؟-0 النمذجة الإحصائية لتحليلات الأعمال: 

بسبب تزايد رواج تحليلات الأعمال؛ فإن الطرق الإحصائية التقليدية والتقنيات الأساسية 
تستعيد أيضًا جاذبيتها كأدوات تمكينية لدعم صُنع القرارات الإدارية المبنية على الأدلة. وهي 
بذلك لا تستعيد فقط الاهتمام والإعجابء ولكنها الآنء تجذب مستخدمي الأعمال إضافةً إلى 
خبراء الإحصاء ومحترفي التحليلات. عادةً ما تُعتر الإحصائيات (الطرق الإحصائية والتقنيات 
الأساسية) جزءًا من التحليلات الوصفية (انظر: الشكل 7-/). كما يمكن اعتبار بعض الأساليب 
الإحصائية أيضًا جزءًا من التحليلات التنبؤية مثل تحليل التمايزء والانحدار ال متعدد» والانحدار 
«a Ul‏ و28أ]ع]وناك ومةعد]!. وكما هو موضّح في الشكل ؟-؛ فإن للتحليلات الوصفية 
فرعين رئيسين.هما: الإحضاءات» ومعالجة التحليلات عبر OLAP i (OLAP) Cyl‏ 
هو المصطلح المستخدّم لتحليل وتوصيف وتلخيص البيانات المهيكلة المخرَّنة في قواعد البيانات 
التنظيمية (غالباً ما يتم تخزينها في مستودع البيانات أو في سوق البيانات» وسيتمٌ تغطية 
تفاصيل مستودعات البيانات في الفصل ۳) باستخدام مكعبات Gİ)‏ هياكل بيانات مُتعدّدة 
الأبعاد والتي يتم إنشاؤها لاستخراج مجموعة فرعية من قيم البيانات للإجابة عن سؤال أعمال 
معين). كما أطلق على فرع 014۴ للتحليل الوصفي اسم ذكاء الأعمال. من ناحية أخرى؛ 
تساعد الإحصائيات في توصيف البيانات dle ls]‏ متغير واحد في كلّ مرة أو متغيرات متعددة 
معًاء باستخدام إما أساليب وصفية أو استنتاجية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wv‏ 


الفصل الثاني 











شكل :۷-١‏ العلاقة بين الإحصاء والتحليلات الوصفية 

كانت الإحصائيات - وهي مجموعة من التقنيات الرياضية لتوصيف وتفسير البيانات - موجودة 
منذ Lög‏ طويل. وقد تمَّ تطوير العديد من الأساليب والتقنيات لتلبية احتياجات ال مستخدمين 
النهائيين ومعالجة الخصائص الفريدة للبيانات التي يتم تحليلها. وبشكلٍ عام» وعلى أعلى مستوى 
فيمكن تصنيف الأساليب الإحصائية على أنها إما وصفية أو استنتاجية. ويكمُنْ الفرق الرئيس 
بين الإحصاء الوصفي والاستنتاجي في البيانات المُستخدّمة في هذه الطرق - في حين يقوم الإحصاء 
الوصفي على وصف بيانات العينة المتاحة» تتعلق الإحصاءات الاستقصائية برسم استدلالات أو 
استنتاجات حول خصائص السكان. وسنقوم إيجارًا في هذا القسم. بوصف الإحصائيات الوصفية 
(لأنها بالفعل تضع حجر الأساس للتحليلات الوصفيةء وثَد كذلك الجزء الأساسي منها)» أما في 
القسم التالي؛ فسنغطي الانحدار (بنوعيه الخطي واللوجستي) كجزءٍ من الإحصاءات الاستدلالية. 


الإحصاء الوصفى للتحليلات الوصفية: 

تُوضّح الإحصائية الوصفية كما يُوحي الاسم» الخصائص الأساسية للبيانات المتحصّل عليهاء 
وغالبًا ما يكون هناك متغيرٌ واحدٌ في كل مرة. وباستخدام ا معادلات وا مجموعات العددية 
تستطيع الإحصاءات الوصفية تلخيص البيانات بطريقة تؤدي في الغالب إلى الخروج من الدراسة 
بأماط سهلة الفهم وذات معنى. وعلى الرغم من أن الإحصاء الوصفي مفيدٌ جدًا في تحليلات 


W^‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية» تصوير البيانات 


البياناتء وأيضًا له الرّواجٍ الأعلى في الاستخدام بين الأساليب الإحصائية؛ فإنه لا يسمح بعمل 
استنتاجات (أو استدلالات) تتجاوز عينة البيانات التي يتم تحليلها. أيْ: إنه ببساطة ig‏ 
طريقةً جيدةً لتوصيف ووصف البيانات المتاحة» دون الحصول على استنتاجات (الاستدلالات 
أو الاستقراءات)؛ وذلك فيما يتعلق بسكان الفرضيات ذات الصّلة التي قد نضعها في الاعتبار. 
وفي تحليلات الأعمال؛ تلعب الإحصائيات الوصفية دورًا حساسًا - فهي تتيح لنا فهم وشرح/ 
تقديم نياناتنا بطريقة هادفة باستخدام الأرقام المجمّعة أو جداول البيانات أو الخرائط/ الرسوم 
البيانية. وفي جوهر الإحصائيات الوصفية؛ فهي تساعدنا على تحويل الأرقام والرموز التي بأيدينا 
إلى تمثيلات ذات معنى يستطيع أي شخص أن يفهمها ويستخدمها بسهولة. لا يساعد هذا 
الفهم مستخدمي الأعمال في عمليات صُنع قراراتهم فحسب؛ بل يساعد كذلك محترفي التحليلات 
وعلماء البيانات على توصيف واختبار صلاحية البيانات للهامّ تحليلية أخرى أكثر تعقيدًا. كما 
يسمح الإحصاء الوصفي للمحللين بتحديد التنسيق «data concertation‏ وكذلك القيم الكبيرة 
أو الصغيرة غير المعتادة (أيْ: القيم المتطرفة)» وقيم البيانات المورّعة بشكلٍ غير متوقع للمتغيرات 
الرقمية. ولذلك؛ فيمكن تصنيف الطرق في الإحصاء الوصفي إما كمقاييس للميل المركزي أو 
مقاييس للتشتت. وسنستخدم في القسم التالي وصفًا بسيطًا وصياغة رياضية/ تمثيلًا رياضيًا 
لهذه المقاييس. في التمثيل الرياضي؛ سنستخدم س١ء‏ سء س۳ ...» سين لتمثيل القيم المنفردة 
(الملاحظات) للمتغير (قياس) الذي نحن بصدد توصيفه. 


مقايبس النزعة المركزية (كما يمكن أن يُطلق عليها مقايبس الموقع, أو المقاييس المركزية): 
dd‏ المقاييس المركزية؛ هي الطرق الرياضية التي نستخدمها في تقدير ووصف الوضع المركزي 
للمتغير المعطى محل الدراسة. وَيّعَدٌ مقياس الاتجاد المركزي قيمةٌ عدديةً مفردةً تهدف إلى 
وصف مجموعة من البيانات؛ من خلال تحديد أو تقدير ا موقع المركزي ضمن البيانات بوضوح. 
ويُعَدُ المتوسط (والذي يُطلق عليه غالبًا الوسط الحسابي أو المتوسط البسيط)» هو المقياس الأكثر 
استخدامًا للاتجاه المركزي. بالإضافة إلى المتوسطء من الممكن أيضًا استخدام الوسيط أو المنوال 
المستخدم لوصف المركزية للمتغير المعطى. وعلى الرغم من أن الوسط الحسابي والوسيط والمنوال 
كلها مقايبس صحيحة للاتجاه المركزي؛ فإنه في بعض الحالات ووفقًا لظروف معينةء تكون إحدى 
هذه المقاييس أكثر ملاءمةً من الأخرى. وفيما يلي أوصاف مختصرة لهذه المقاييس: مما في ذلك 
كيفية حسابها رياضيًا مع الإشارة إلى الظروف التي تجعل أحدها أنسب في الاستخدام من غيره. 
- الوسط الحسابي: (أو المتوسط البسيط أو المعدل) هو مجموع كلّ القيم/ الملاحظات مقسومًا على 
عدد تلك الملاحظات في حزمة البيانات. وهو إلى حَدَّ بعيد يُعَنَّ الأكثر رواجًا وشيوعًا في قياس النزعة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wa‏ 


الفصل الثاني 


ا مركزية. ويتم استخدامه مع بيانات رقمية مستمرة أو منفصلة. بالنسبة للمتغير سء إذا حصلنا 
على عدد ن من القيم/ الملاحظات os)‏ س۲» س٣٠‏ ...» س ن)؛ فيمكننا كتابة الوسط الحسابي لعينة 
البيانات (سء وتنطق س - بار) كما يلي: (يتم استبدال كل (×) ب س» وکل (o 2 (n)‏ 


2 Atat ti 
لسس ستاك د عر‎ 


n 


n 
يمتلك الوسط العديد من الخصائص الفريدة؛ فعلى سبيل المثال: يكون مجموع الانحرافات‎ 
المطلقة (الفروق بين الوسط الحسابي والقيم) فوق الوسط هي نفس مجموع الانحرافات التي‎ 
تحت الوسط مع مراعاة توازن القيم في كلا الجانبين. ومع ذلك فإن هذا لا يعني أن نصف‎ 
عدد القيم يكون أعلى الوسط الحسابيء والنصف الآخر أقل منه (فهذا اعتقادٌ خطأ شائعٌ بين‎ 
محفوعة‎ UI as Gli hall aS أولّقك الذين لا يعرقوة الإحضانيات الأساسية): وأيضا‎ 
اعد أكز‎ sis للعسنات لكل.ها وتعلق بالبيانات:والفتزات العددية.‎ j.3 uina ad «olo 
العيوب الرئيسة في الوسط الحسابي؛ هو تأثره بالقيم المتطرفة (القيم التي تكون أكبر أو أصغر‎ 
بكثير من بقية نقاط البيانات). إذ تقوم القيم المتطرفة بسحب الوسط نحوهاء وبالتالي يحدث‎ 
تحيِّز في التمثيل المركزي. ولذلك؛ في حالة وجود قيم متطرفة أو إذا كانت البيانات مبعثرة‎ 
ومنحرفة بطريقة عشوائية؛ فيجب على المحلل تجنّبٍ استخدام الوسط الحسابي كمقياس‎ 
مركزي أو إضافته مع مقاييس النزعة المركزية الأخرى» مثل: الوسيط والمنوال.‎ 
الوسيط: هو مقياس لقيمة المركز في حزمة البيانات المعطاة. أيْ: هو الرقم الواقع في وسط‎ - 
(Ols مجموعة معينة من البيانات التي تمَّ ترتيبها / فرزها حسب حجمها (إما تصاعديًا أو‎ 
على‎ flo إذا كان عددُ القيم رقمًا فرديًا؛ فإن تحديد الوسيط سهل للغاية - فقط قم بفرز القيم‎ 
قيمها واختر القيمة الصحيحة التي في الوسط تمامًا. أما إذا كان عدد القيم رقمًا زوجيًا؛ فقم‎ 
بتحديد القيمتين الواقعتين في المنتصفء ثم خذ المتوسط البسيط لهاتين القيمتين. يُعَدُ الوسيط‎ 
ملائماً وقابلاً للحساب لأنواع معينة من البيانات كالنّسبء والفترات الفاصلة؛ والبيانات الترتيبية.‎ 
وبمجرد تحديد الوسيطء يكون نصف عدد البيانات في الأعلى منه والنصف الآخر أدناه. وعلى‎ 
عكس الوسط الحسابيء لا يتأثر الوسيط بالقيم المتطرفة أو البيانات المنحرفة.‎ 
Sag المنوال: هو القيمة التي تحدث بشكل متكرر (القيمة الأكثر تكرارًا في مجموعة البيانات).‎ - 
تمثيله على الرسم البياني بالعمود الأعلى» وبالتاليه يمكن اعتباره الخيار/ القيمة الأكثر شيوعًا.‎ 


x- 








ye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية: تصوير البيانات 


ويكون المنوال مفيدًا جدًا في حالة مجموعات البيانات التي تحتوي على عدد صغيرٍ نسبيًا من 
القيم الفريدة. أي إنه قد يكون عديم الفائدة إذا كانت البيانات تحتوي على الكثير من القيم 
الفريدة (كما هو الحال في العديد من القياسات الهندسية ذات الدقة العالية» والعدد الكبير 
من الخانات العشرية)؛ مما يجعل كلّ قيمة تحتوي على رقم واحد تمثل تكرارًا خاضًا بها. وعلى 
الرغم من كونه مقياقا مَقَيدًا (خاضة اللبيانات الانسمية)» فؤإده لعفل اللركرية: بصورة جيدة؛ 
ولذلك لا ينبغي استخدامه كمقياس وحيد للنّزعة المركزية لمجموعة بيانات معينة. 
باختصار؛ أيٌّ من مقايبس الاتجاه المركزية يُحَدَ الأفضل؟ في الواقع لا تُوجّد هناك إجابةٌ 
واضحة لهذا السؤال؛ ولكن هناك بعض الإشارات نعرض لها فيما يلي: استخدم الوسط الحسابي 
عندما لا تكون البيانات ميّالة للقيم المتطرفة» وليس بها انحرافات معنوية؛ استخدم الوسيط 
عندما تكون بالبيانات قيم متطرفة و/ أو أن تكون بطبيعتها بيانات ترتيبية؛ استخدم المنوال 
عندما تكون البيانات اسمية. ولعل أفضل هذه الممارسات هو استخدام كلّ هذه المقايبس الثلاثة 
Lze‏ بحيث يمكن الوصول للاتجاه المركزي لمجموعة البيانات» وتمثيله من وجهة نظر ola JS‏ 
على حِدّة. ولأن المعدّل ”أو المتوسط“ هو يكون غالبًا مفهومًا مألوقًا للغاية ومُستَحْدَما بشكلٍ 
zS‏ للجميع في الأنشطة اليومية المتكرّرة بانتظام؛ فغالبًا ما يستخدم المديرون (وكذلك بعض 
العلماء والصحفيين) المقاييس المركزية (خاصة الوسط الحسابي) بشكلٍ غير ملائم خاصةً عندما 
يستلزم الأمر التعامل مع المعلومات الإحصائية الأخرى من منظور المركزية. ومن الأفضل تقديم 
إحصائيات وصفية كحزمة - عبارة عن مزيج من مقاييس مركزية وتشئت - في مقابل مقياس 
واحدٍ مثل الوسط الحسابي. 1 


مقاييس التشدّت (وتُسمّى أيضًا مقايبسٌ الانتشار أو الامتداد): 

caa! aulis X‏ هي الطرق الرياضية المُستَخدّمة لتقدير أو وَصْف درجة التباين في المتغير 
المعطى الذي يكون محل الدراسة. وهي تمثل الانتشار الرقمي (الاكتناز أو عدمه) لمجموعة البيانات 
المعطاة. ولوصف هذا التشتت» تم تطوير عدد من المقاييس الإحصائية؛ وأبرزها: النطاق» والتباينء 
والانحراف المعياري (وكذلك الربيعات: والانحراف المظلق): يُعَدّ أحد الأسباب الرئيسية وزاء أهمية 
مقاييس تشثْت/ انتشار قيم البيانات» هو أنه يمنحنا إطارًا يمكننا من خلاله الحكم على النزعة 
المركزية - وذلك بأن يعطينا إشارةً إلى مدى جودة الوسط الحسابي (أو المقاييس المركزية الأخرى) 
عند تمثيل بيانات العينة. وإذا كان تشّت القيم في مجموعة البيانات كبيرا؛ فلا يعبر الوسط الحسابي 
تمثيلًا جيدًا للبيانات. وذلك لأن قياس التشبّت الكبير يشير إلى اختلافات كبيرة بين الدرجات المنفردة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Me‏ 


الفصل الثاني 


وفي البحث Led‏ غالبًا ما يُنظر إليه على أنه علامة إيجابية لرؤية تباين صغير داخل كلّ عينة بيانات؛ 

إذ إنه قد يشير إلى التجانس, والتشابهه وامتانة ضمن البيانات التي تم جمعها. 

- النطاق: قد يكون النطاق أبسط مقياس للتشتت. والنطاق هو الفرق بين أكبر قيمة وأصغر 
قيمة في مجموعة البيانات المعطاة (أيْ: المتغيرات). أي إننا نحسب النطاق ببساطة عن طريق 
تحديد أصغر قيمة في مجموعة البيانات (الحد الأدنى). وتحديد أكبر قيمة في مجموعة البيانات 
(الحد الأقصى). وحساب الفرق بينهما أيّْ: (النطاق - الحد الأقصى - الحد الأدفى). 

- التباين: هو مقياسٌ أكثر شمولًا وتطؤرًا للتشتُّت. ويُستخدّم التباين لحساب انحراف جميع نقاط 

البيانات في مجموعة البيانات المعطاة عن الوسط الحساي. وكلما كان التباين أكبر, زاد انتشار 

gs Obl (cis)‏ الوسط وأيضًا زاد تنؤعها بالشكل الذي يسمح لأيّ شخص ملاحظته في عينة 

البيانات. ولمنع اختلاط الفروق السلبية والإيجابية» يأخذ التباين مربع المسافات من الوسط الحسابي 

في الاعتبار. ويمكن كتابة معادلة عينة البيانات كالتالي: (يتم استبدال كلّ (:) ب س.ء وكل (2) ب ن) 








n-i 
حيث ن هي حجم العينة» وس (عليها شرطة) هو الوسط الحسالي للعينة,‎ 
التباين الأكبر إلى مزيدٍ‎ G3 وس (بجوارها 1 صغيرة) هو القيمة ذات الترتيب (1) في العينة. تشير‎ 
من التشتّت؛ في حين تشير القيم الأصغر إلى انضغاط نقاط البيانات في حزمة البيانات الكلية.‎ 
ونظرًا لأن الفروق مربعة؛ فإن الانحرافات الأكبر عن الوسط الحسابي تُسهم بشكلٍ معنوي في‎ 
قيمة التباين. مرةً أخرىء ونظرًا لأن الفروق مربعة؛ فإن الأرقام التي تمثل الانحراف/ التباين‎ 
تصبح غير ذات معنى إلى حَذّ ما (في مقابل الفرق بالدولار. وهنا يتم الحصول على فرق مربع‎ 
للدولار). لذلك؛ ففي العديد من تطبيقات الأعمال لا نستخدم التباين كمقياس للتشتت»‎ 
ونستعيض عنه بمقياس آخر يعطي للتشتّت معنّى أفضلء ويُسمّى الانحراف المعياري.‎ 
الانحراف المعياري: هو أيضًا مقياسٌ لانتشار القيم ضمن مجموعة من البيانات. ويتم حسابه‎ - 
ببساطة عن طريق أخذ الجذر التربيعي للتغيرات. وتوضّح الصيغة التالية حساب الانحراف‎ 
ب ن)‎ (n) ب سء وكل‎ (X) ÚS ا معياري من عينة معينة من نقاط البيانات: (يتم استبدال‎ 





MY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية: تصوير البيانات 


- متوسط الانحراف المطلق: إضافةً إلى التباين والانحراف المعياريء نستخدم أيضًا في بعض 
الأحيان متوسط الانحراف المطلق لقياس التشئُت في مجموعة البيانات. djs‏ استخدام هذا 
المقياس طريقة أبسط لحساب الانحراف الإجمالي عن الوسط الحسابي. وعلى وجه التحديد 
يتم حساب متوسط الانحراف المطلق من خلال قياس القيم المطلقة للفروق بين كل نقطة 
من نقاط البيانات والوسط الحسابيء ثم جمع تلك القيم. ويوفّر ذلك مقياسًا للانتشار دون 
أن يكون محددًا حول نقطة بيانات تكون أدنى أو أعلى من الوسط الحساي. وتوضّح الصيغة 
التالية حساب متوسط الانحراف المطلق: 


ادا _ 


n 


MAD 


- الربيعات والنطاق الرُبيعي: تساعدنا الرُبيعات على تحديد الانتشار داخل مجموعة فرعية 
من البيانات. ويشكل الرُبيع ربع عدد نقاط البيانات المعطاة في مجموعة البيانات. ولتحديد 
الربيعات يتم أولًا ترتيب البيانات» ثم بعد ذلك يتم تقسيم تلك البيانات المرتبة إلى أربع 
مجموغات بيانات أضغر منفضلة بعضها عن بعض. ig‏ البيعات مقيامًا مفيدًا scÁ aal‏ 
لأنها - مقارنة بالمقاييس المناظرة الأخرى - أقل تأثرًا بالقيم المتطرفة أو الانحرافات في مجموعة 
البيانات بالكامل. وغالبًا ما يتعُ استخدام الرُبيعات كأفضل خيار لقياس التشئُت كما يتم اعتبار 
الوسيط هو مقياس التشتّت الأنسب لقياس الاتجاه المركزي؛ وذلك عند التعامل مع الانحراف و/ 
أو البيانات ذات القيم المتطرفة. إِنَّ الطريقة الشائعة للتعبير عن الرُبيعات هي النطاق (المدى) 
الرُبييعيء والتي تصف الفرق بين الربيع الثالث (93) والربيع الأول (Q1)‏ وهذا الفرق يعطي 
dV»‏ على مدى النصف الأوسط من الدرجات في التوزيع. ويُعَدُ أفضل شرح أو توضيح للمقاييس 
الوصفية المستندة على الرُبيعات (سواء كانت مقاييس مركزية أو مقاييس (C23‏ 52 3573 
popular plot pius k‏ والذي -(box-and-whiskers plot) 5i a box plot Là 4e (3l‏ 
- مُخطط الصندوق وطرفاه 2106 ورمع أون80-20-117 أو ببساطة الرسم الصندوقي 7106 ×0ط 4: هو 
سم بياني يُوضّح العديد من الإحصائيات الوصفية حول مجموعة البيانات المعطاة. ومن 
الممكن أن يكون هذا الرسم إما أفقيًا أو رأسيًا؛ ولكن الرأمي هو التمثيل الأكثر شيوعًا؛ خاصةً 
في منتجات برمجيات التحليلات الحديثة. ومن المعروف أنَّ أول مَنْ أنشأ هذا المخطط وقدَّمه 
MD eM ele (3 John W. Tukey s—a‏ الشکل ۸-۲ زوجين من 1015م 80 جنبًا إلى 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yer‏ 


الفصل الثاني 


جنبء يتشاركان نفس المحور لا (أو ص على حسب الطباعة للشكل). كما هو موضح هناء 
بمكن أن يحتوي مخططاً واحداً على ]10م :50 واحداً أو أكثر لأغراض المقارنة المرئية. في مثل 
هذه الحالات؟ يكون المحور لإ (أو ص على حسب الطباعة للشكل)؛ هو المقياس الشائع للحجم 
(القيمة العددية للمتغير)» في حين يُعَبّر المحور السيني (أو *) عن فئات مختلفة/ مجموعات 
فرعية مختلفة كالأبعاد الزمنية المتفاوتة (مثل: إحصائيات وصفية لنفقات الرّعاية الطبية 
السنوية في عام ١10‏ م مقابل عام 17١1م)‏ أو فئات مختلفة (مثل: الإحصاء الوصفي لنفقات 
التسويق مقابل إجمالي المبيعات). وعلى الرغم من أنه تاريخيًاء م يتم استخدام de box plot‏ 
نطاق واسع ها يكفي في الغالب (وخاصة في المناطق خارج الإحصاءات)» ومع الرّواج الحاصل 
لتحليلات الأعمال الناشتئة؛ فإنه (أَيْ: :10م <00) يكتسب الشهرة في المجالات الأقل تقنيةً في 
عام الأعمال. ويؤدي ثراء المعلومات الناتجة من اهام ×0ط وأيضًا سهولة فهمها إلى حَذّ كبير 
إلى زيادة الثقة فيه ورواج استخدامه في الآونة الأخيرة. يُوضح اهام ×٥ط‏ المركزية (الوسيط 
وأحيانًا أيضًا الوسط الحسابي)» وكذلك التششّت (كثافة البيانات في النصف الأوسطء والمرسومة 
كصندوق بين الربعين الأول والثالث)» والحدان الأدنى والأقصى (والموضحة كخطوط ممتدة من 
الصندوق» تبدو كالشوارب» والتي يتم حسابها على أنها ١.0‏ أضعاف الطرف العلوي أو السفلي 
من الصندوق الرُبيعي) إلى جانب القيم الشاذة الأكبر من حدود الشوارب. يوضّح غمام هط 
أيضًا ما إذا كانت البيانات مُورّعة بشكل متماثلٍ فيما يتعلق بالوسط الحسابي أو أنها تتمايل 
بطريقة أو بأخرى. ويعطي الموضع النسبي للوسيط مقابل الوسط الحسابي وأطوال الشعيرات 
الممتدة على جانبي الصندوق دلالةَ جيدةً على الانحراف المحتمل في البيانات. 


ع1 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 












2 di LS ga a6 
oana A الأعلى‎ ea 
ge أكبر قيمة ولا تمل‎ 
کر لد ال تك‎ 
o 
1 هن البيانات أكبر‎ 96 
من هذه القيمة الربيع الأعلى._ _- ي‎ 
من الباتات أكير من هذه القيمة‎ 50% 
> --  طيسولا‎ -A3 نت مجموعة‎ 
 ياصحلا المتوسط البسيط لمجموعة البيانات الوسط‎ 
من البیاتات أصغر  الربيع الأدنى. م‎ 25% 
من هذه القيمة‎ 
PEES ES] أصغر قيمة »ولا تشمل أصغر‎ 
قيمة شاذة‎ 
Ox 
o A AL E أصغر من 1.5 مرة فى‎ 
دتري‎ E Ea 
1 متغير2 متغير‎ 





شكل 6-7: فهم التفاصيل عن Box-and-Whiskers cosas‏ 


شكل التوزيع: 

على الرَّْم من أنه ليس شائعًا مثل المركزية والتشتت؛ فإن شكل توزيع البيانات يُحَدُ أيضًا مقياسًا 
مفيدًا للإحصاءات الوصفية. ولكن قبل الخوض في شكل التوزيع؛ نحتاج أولًا إلى تعريف التوزيع 
نفسه. ببساطة نقول: إِنَّ التوزيع هو تكرار نقاط البيانات التي يتم حسابها ورسمها على عددٍ صغيرٍ 
من العلامات الفئوية أو النطاقات العددية (أيْ: صناديق التخزين). وعند رسم التوزيع بيانيّاه يعرض 
المحور '( (أو ص) التكرار (عدد أو نسبة مئوية)» في حين يعرض ال محور × (أو س) الطبقات ال منفردة 
أو الصناديق بنمط ترتيبي. يُسمَّى التوزيع المعروف جيدًا بالتوزيع الطبيعيء والذي يتطابق تمامًا 
على كلا جانبي الوسط الحسابيء ويحتوي التوزيع الطبيعي على العديد من الخصائص الرياضية التي 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yeo‏ 








الفصل الثاني 


تمّ إنشاؤها بشكلٍ جيد والتي تجعله أداةً مفيدةً جدًا للبحث والممارسة. وكلما زاد تبت مجموعة 
البيانات؛ زاد الانحرافٌ ال معياري وكذلك يبدو شكل التوزيع أعرض. يعرض الشكل 9-7 رسماً بيانياً 
للعلاقة بين التشتّت وشكل التوزيع (وذلك في سياق الكلام عن التوزيع الطبيعي). 


N | 


V J 


N 





AA 
1 
$ 
! 
! 
i 
i 
! 
I 
أ‎ 
t 
1 

L (a) 

Y | 
t 

p= [i 
' 
I 
1 
1 
! 

| 
i 
0 

















شكل 4-7: العلاقة بين التشتت وخصائص الشكل 


يُوجَّد نوعان من المقاييس الشائعة الاستخدام لحساب خصائص شكل التوزيع وهما: الانحراف 
والتفرطح. وغالبًا ما يستخدم الرسم البياني (مخطط التكرار) لتوضيح JS‏ من الانحراف والتفرطح. 
- الانحراف: هو قياس لعدم التماثل (التمايل) في توزيع البيانات التي تصوّر هيكلاً أحاديّ الشكل 
- في هذا التوزيع للبيانات تُوجَد قمة واحدة فقط. ولأن التوزيع الطبيعي هو توزيعٌ أحاديٰ 


1 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 














التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية: تصوير البيانات 


الشكل متماثلٌ تمام؛ فلا يُوَجَّد به انحرافات؛ أي إِنَّ قياس الانحراف (أو قيمة معامل الانحراف) 
يساوي الصفر. ويمكن أن يكون قياس/ قيمة الانحراف إما بالموجب أو بالسالب. إذا مال التوزيع 
ناحية اليسار (أي إِنَّ الذيل على الجانب الأيمن وكان الوسط الحسابي أصغر من الوسيط)؛ فإنه 
ينتج عنه مقياس انحراف موجب. أما إذا مال التوزيع ناحية اليمين (أي إِنَّ الذيل على الجانب 
الأيسر وكان الوسط الحسابي أكبر من الوسيط)؛ فعندئذ يكون الانحراف سالباً. ففي الشكل ٩-۲‏ 
يمثل المنحنى (©) توزيعًا منحرقًا موجبًاه في حين يمثل ا منحنی (4) توزيعًا منحرفًا سالبًا. وفي نفس 
الشكل» هثل كل من () و(ط) تماثلاً مثالياً وبالتالي قياس الانحراف يساوي صفر. 


Xin zd 
Skewness = S = ——— —;— 
6ن‎ - 


حيث ؟ هو الانحراف المعياري» qo ns‏ حجم العينة. 
- التفرطح: هو مقياسٌ آخر لاستخدامه في تحديد خصائص شكل التوزيع الأحادي. وبغض النظر 
عن ميل شكل التوزيع؛ فإنَّ التفرطح أكثر اهتمامًا بتمييز طبيعة التوزيع من حيث القمة/ 
الطول/ النحافة. وبشكل أكثر تحديدًا؛ فإِنَّ التفرطح يقيس درجة ارتفاع أو انخفاض قمة 
التوزيع عنها في التوزيع الطبيعي. في حين يشير التفرطح الموج ب إلى توزيع مدبب/ طويل 
نسبيًاء ويشير التفرطح السَّلبي إلى توزيع مسطح/ قصير نسبيًا. وكنقطة مرجعية؛ فإن التوزيع 
الطبيعي له تفرطح . ويمكن كتابة معادلة التفرطح كالتالي: 
f 1‏ ب 
ns ^‏ 


r 


Kurtosis — K — 


إِنَّ الإحصائيات الوصفية (شأنها شأن الإحصائيات الاستنتاجية) هكن حسابها بسهولة؛ 
وذلك باستخدام حزم برمجية إحصائية ذات جدوى تجارية (مثل: 545 أو SPSS‏ 
أو gf (Statistica 3 JMP sÍ Minitab‏ البرامج اممجانية/ المفتوحة (مثل: ۸). ولعل الطريقة 
fad AYI‏ لحساب الإحصائيات الوصفيةء وبعض الإحصائيات الاستنتاجية هو استخدام 
جداول الإكسل. وتوضّح الفكرة التقنية ١-1‏ بالتفصيل كيفية استخدام جداول مايكروسوفت 
إكسل لحساب الإحصائيات الوصفية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري MN‏ 








الفصل الثاني 


رؤية فنية ١-۲‏ 

كيفية حساب الإحصائيات الوصفية باستخدام جداول مايكروسوفت إكسل 

يمكن القول بأن برنامج إكسل يُعَدُ أداة تحليل البيانات الأكثر شيوعًا في العلم. كما 
يمكن استخدامه بسهولة بالنسبة للإحصاءات الوصفية. وعلى الرغم من أن التكوين 
الأساسي لبرنامج إكسل لا oos)‏ أن به دوال إحصائية متاحة للمستخدمين النهائيين؛ 
فإنَّ هذه الدوال يمكن تثبيتها وتنشيطها (عند التشغيل) بالقليل فقط من نقرات 
الماوس. ويوضّح الشكل ٠١-1‏ كيفية تنشيط هذه الدوال الإحصائية (كجزءٍ من تحليل 
Y VV aS] sus Sols à (ToolPak‏ 







Quick Access Toolbar 






Manage: Excel Add-ins لها‎ ] s- |] 


[7] Anatysis ToolPak - VEA 
V] Anatytic Sotver Platform 
Euro Currency Tools. 
[E] Solver Add-in 











Align I 


sciens Analysis ^ 
ع‎ | Data Analysis Tools 


Tools for Financial snd scientific date 
analysis. 





FÈ FUNCRESXLAM 
Tell me more 








شكل :1١-7‏ تفعيل الدوال الإحصائية في PNT LaS)‏ 


MA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


وجرد تفعيل الدوال الإحصائية؛ سيظهر تحليل ع1ه10015 في خيار قائمة البيانات 
C55 (Data)‏ اسم تحليل البيانات (82217515 äl ueg .(Data‏ فوق ”تحليل 
البيانات أو "(Data Analysis)‏ 3( مجموعة ”التحليل أو (4:817515)" تحت علامة 
التبويب ”البيانات أو (هة0)“ في شريط قوائم إكسلء ستشاهد ”الإحصائيات الوصفية 
أو (5عناقنأة)5 عانامنىءو1)“ كأحد الخيارات الموجودة ضمن قائمة أدوات تحليل 
البیانات (انظر: الشکل ۱۱-۲ الخطوات ١[‏ و7])؛ انقر فوق ”موافق أو 010)": 
وسيظهر :,B3l) "(Descriptive Statistics) 44255J] GULaz- VI" 5lsiso jloo gj‏ 
منتصف الشكل .)١١-7‏ في مربع الحوار هذا تحتاج إلى إدخال نطاق البيانات» والتي 
يمكن أن يتم تمثيلها بواحدٍ أو أكثر من الأعمدة الرقمية» إلى جانب مربعات فحص 
التفضیلات» وانقر فوق 0۸ (انظر: الشکل V V-Y‏ الخطوات [۲ و٤]).‏ إذا تمّ تظليل 
SÌ (Selection)‏ من عمود رقمي واحد؛ فستقوم الأداة معالجة كلّ عمود على أنه 
مجموعة بيانات منفصلةء ومن ثم ستقدم إحصائيات وصفية Sio de ogas JII‏ 





3| te amana 
2| Ts iare 
| Sios eer 
2| ar wwo 
| => ime 
$| e» iim 
9| sso هدجو‎ 
. Sarmi nsss 
| ر‎ ie 
isl com isis 
ii| — fi o ims 
بد جور ت‎ 
i) Hee imer 
4 مده‎  ةدعم«‎ 
ر ي‎  ةدحدم‎ 
as 1722 
l 








شكل ؟9-١1:‏ الحصول على الإحصائيات الوصفية في برنامج إكسل 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1 











الفصل الثاني 


7 وكمثالٍ بسيط اخترنا عمودين (تمّ وَضْع عنوانين لهما: مصاريف وطلبات) 
ونفذنا خيار الإحصاء الوصفي sj2dl eos? (Descriptive Statistics)‏ السفلي 
من الشكل ١١-۲‏ المخرجات التي تم إنشاؤها بواسطة إكسل. وكما يتضح؛ أنتج 
إكسل جميع الإحصائيات الوصفية التي تت تغطيتها في القسم السابقء وإضافة 
المزيد منها إلى القائمة. وفي إكسل 17١٠م‏ من السهل جدًا أيضًا (بقليلٍ من نقرات 
الماوس) أن يتم إنشاء 5ع اونط-20ه-دهط ه. كما يُوَضَّح الشكل 17-7 العملية 
البسيطة واطمكونة من ثلاث -Ja5] à abox-and-whiskers «Li5y cols‏ 


m 
laxo 


| 









E i bz» 
a no Ld Une Cok 
4 ay d 

s e» uum 

6 «o non 

7| me v 

s. su 11558 

s| m™ wos 

30 on 11828 

n| ne um» 

n n» uw 

13 772 11167 

u| a sa 

15 2267 11524 

»| we ins 

r em 


7١1١5 إكسل‎ $ Box-and-Whiskers Jalazx eU] :W-Y Js à 

وعلى الرغم من أنَّ هذه الأداة تُعَدُ مفيدةً جدًا في إكسل؛ فإنه يتحثّم على 

المحلّل أن يكون ls‏ بنقطة مهمة تتعلق بالنتائج المتحصّل عليها بواسطة تحليل 
ToolPak‏ والتي تنتهج سلوكًا مختلقًا عن وظائف الإكسل الأخرى المعتادة. 
وعلى الرغم من أن وظائف إكسل تتغيّر ديناميكيًا مثلما تتغيّر البيانات الأساسية 
في جدول البيانات؛ فإنه لا يتم تغيير النتائج التي تم إنشاؤها بواسطة تحليل 
ع1ه10012. وعلى سبيل المثال: إذا قمتّ بتغيير القيم في أيّ من هذين العمودين 
أو كليهما؛ فستبقى نتائج الإحصائيات الوصفية التي أنتجها ToolPak J4le3‏ 
كما هي دون تغيير. ومع ذلك؛ لا ينطبق الأمر نفسه على وظائف إكسل ال معتادة. 
إذا كنتَ قد قمتّ بحساب قيمة الوسط الحسابي لعمود ما (باستخدام الدالة 
5 للنطاق من (81:4121). ثم قمتّ بتغيير القيم داخل نطاق 
البيانات؛ فسوف تتغير قيمة الوسط الحسابي تلقائيًا. أي إنه باختصار, لا تحتوي 


yos‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات الوصقية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


النتائج التي ينتجها تحليل ع1ه10015 على رابط ديناميي للبيانات الأساسية: وإذا 
تم el ae‏ بيان؛ فيجب إعادة التحليل مرةً أخرى باستخدام مربع الحوار. 

تغطي التطبيقات الناجحة لتحليلات البيانات نطاقًا واسعًا من إعدادات 
الأعمال والتنظيماتء ومعالجة المشكلات التي كان يُعتقد في السابق أنها غير قابلة 
للحل. وتمثل الحالة العملية ۲٠۳‏ مثالا as‏ لهذه القصص الناجحة؛ إذ تتبَنّى 
إدارة بلدية صغيرة منهج تحليل البيانات لكشف وحل المشكلات بذكاء من خلال 
تحليل أنماط الطلب والاستهلاك بشكلٍ مستمر. 


حالة عملية Y-Y‏ 
مدينة كاري تستخدم التحليلات لتحليل البيانات من أجهزة الاستشعار وتقييم الطلب 
والكشف عن المشكلات 

ِنَّ تسرب المياه من الحنفيات» والخلل بغسالة الصحونء وطفايات الحريق المكسورة؛ 
َد من أكثر المشكلات المؤرقة لأيّ مالك منزل أو ممارس لأعمال تجارية إلى أن يتم 
إصلاحها. وهذه المشكلات قد تكون مكلفةً ولا يمكن التنبؤ بهاء وللأسف» يكون من 
الصعب تحديدهها. وقد تمّ تسهيل عملية اكتشاف وإصلاح المشكلات التي تؤدي إلى 
نقصان أو فقدان الماء في مدينة كاري بشمال كارولينا؛ وذلك من خلال مجموعة من 
عدّادات المياه اللاسلكية وبوابة إلكترونية معتمدة على البيانات يسهل الوصول إليها 
بواسطة جميع العملاء. في هذه العملية. حصلت المدينة على رؤية ذات صورة كبيرة 
عن حساسية استخدام اللياه؛ وذلك لتخطيط التوسّعات في محطات اللياه المستقبلية, 
وتعزيز جهود الصيانة المستّهدّفة. عندما قامت مدينة كاري بتثبيت العدّادات اللاسلكية 
لعدد 7٠٠٠٠‏ مشترك في عام ١٠٠"م؛‏ علمت إدارة البلدة أنَّ التقنية الجديدة لن تقتصر 
على توفير المال عن طريق إزالة القراءات الشهرية يدويا؛ بل أدركت المدينة أيضًا أنها 
ستحصل على معلومات أكثر دقةٌ وفي الوقت ا مناسب حول استهلاك اللمياه. يقرأ النظام 
Olola Aquastar Slul‏ ,5 واحدة كلّ ساعة؛ مما يعني الحصول على ۸۷1١‏ 
نقطة بيانات JS Jose JJ‏ عام بدلا من قراءة شهرية واحدةء ما يعني ٠١‏ نقطة بيانات 
فقط لكل عميل على مذار العام. كان للبيانات قدرات هائلة» إذا كان من الممكن 
الحصول عليها وتحليلها بسهولة. يقول امدير المالي لإدارة بلدة كاري كارن ميلز: «إن 
القراءات الشهرية لعدادات امياه تشبه الحصول على جالون من بيانات اطياه المهمة» US‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yoy‏ 


الفصل الثاني 


القراءة كل ساعة للعدادات فتشبه إلى حَدَّ كبير الحصول على حمام سباحة من الحجم 
الأولمبي مملوء بالبيانات. كما يساعدنا برنامج 545 في إدارة حجم تلك البيانات بشكلٍ 
رائع“. في الواقع؛ فإن هذا الحل كن إدارة المدينة من تحليل عدد نصف مليار نقطة 
بيانات تخ استخدام امياه وجعلها متاحة وسهلةً الاستخدام لجميع العملاء. 

إن القراءة المباشرة كلّ ساعة للعدَّادات سوء المنزلية أو التجارية أنتجت بعض 
التطبيقات العملية جدًاء وهي: 

- يمكن لإدارة البلدة إخطار العملاء بأيّ تسريبات مُحتمّلة في غضون أيام. 

- يمكن للعملاء تلشّي تنبيهات تخطرهم في غضون ساعات بوجود ارتفاع في استخدام المياه. 

- يمكن للعملاء مراقبة معدّلات استهلاكهم للمياه عبر الإنترنت؛ مما يساعدهم على 
المبادرة في الحفاظ على اطياه. 

من خلال البوابة الإلكترونية؛ شهدت إحدى المؤؤّسسات التجارية في مدينة كاري 
ارتفاعًا حادًا في استهلاك المياه في عطلات نهاية الأسبوع؛ في الوقت الذي يقضي فيه 
اموظفون تلك العطلات خارج اممدينة. كان ذلك als Uo e Dal‏ ولكن القراءة غير 
العادية للعدّادات ساعدت الشركة على اكتشاف خلل في غسالة الصحون التجارية؛ مما 
يجعلها تعمل بشكلٍ مستمر خلال عطلة نهاية الأسبوع. وبدون بيانات عدادات المياه 
اللاسلكية والبوابة الإلكترونية المتاحة للعملاء» كان من الممكن أن تحدث هذه المشكلة 
دون أن يلاحظها أحدٌ؛ مما يؤدي إلى استمرار إهدار الماء والمال. 

استخدام تلك البوابة الإلكترونية أعطى المدينة رؤيةً أكثر دقةٌ عن الاستخدام اليومي 
للمياه لكلّ شخصء وهو أمرٌ حساسٌ في التخطيط للتوسّعات المستقبلية في منشآت 
المياه. ولعل الميزة الأكثر ÉA‏ للانتباه هي أن المدينة تمكّنَت من التحقّق من أمرٍ ما 
كان له تأثيرٌ بعيد المدى على تكاليف فروع الشركة المختلفة, ألا وهو أن سكان كاري 
اقتصاديون جدًا في استخدامهم للمياه. وتقول مديرة الموارد المائية في المدينة ليلى 
جودوين: ”إننا نقوم بحساب ذلك باستخدام أجهزة حديثة ذات كفاءة عاليةء ويمكن 
أن يصل استخدام المياه في الأماكن المغلقة إلى 0"! جالونًا لكل شخصٍ ف اليوم الواحد. في 
حين يبلغ معدل استخدام سكان كاري 65 جالونا. وهو لا يزال يُعَدُ معدلًا منخفضًا إلى 
Ségo lia iS U “uS i>‏ كانت المدينة تنفق الأموال لتشجيع ترشيد استخدام 
المياه» مثل: تقديم خصومات على ال مراحيض المنخفضة التدفق أو عمل تخفيضات على 


or‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصقية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


براميل الأمطار. والآن يمكن اتخاذ نهج أكثر استهداقًاء ومساعدة مستهلكين مُحدّدين 
على فهم وإدارة استخدام المياه سواء في الأماكن المغلقة أو ايلفتوحة. 

مم يكن برنامج 545 على قدرٍ من الأهمية لتمكين السكان من فهم استخدامهم 
للمياه فحسب؛ ولكنه أيضًا لعب دورًا خفيًا لربط قاعدق بيانات متباينتين. يقول ميلز: 
”لدينا قاعدة بيانات للفواتير وقاعدة بيانات أخرى لقراءة العدادات. لقد كنا في حاجة 
إلى تطويرهما معًا وجعلهما قابلتين للتطبيق“. 

وتّقدّر إدارة ا مدينة أنه مجرد إزالة الحاجة للقراءات اليدوية؛ سيوفر نظام Aquastar‏ 
أكثر من ٠١‏ مليون دولار فوق تكلفة المشروع. ولكن يمكن أن يوفر مكوّن التحليلات 
وفورات أكبر. وبالفعل؛ فقد استطاع كل من المدينة واممواطنين الأفراد توفير قدرٍ من امال 
عن طريق الاكتشاف المبكر تسرب المياه. وبينما تمضي قُدُمَا في تخطيط احتياجات البنية 
التحتية المستقبلية؛ فإن حصول مدينة كاري على معلومات دقيفة حول استخدام المياه 
سيساعدها على الاستثمار في العدد الصحيح من البنية التحتية في الوقت المناسب. وإضافة 
إلى EUS‏ فإن فهم استخدام المياه سيساعد المدينة إذا لحق بها شيءٌ ضار مثل الجفاف. 

تقول ليلى جودوين: ”لقد مررنا بالجفاف في عام ۲۰۰۷م» وإذا حدث هذا مرةً 
أخرىء» فلدينا خطة لاستخدام بيانات 80113501؛ لمعرفة كمية الياه التي نستخدمها 
على أساس يومي والتواصل مع العملاء. يمكننا عرض ما يحدث هناء وإليك عزيزي 
ا مواطن المقدار الذي يمكنك استخدامه حال انخفاض منسوب الماء لدينا. ونأمل 
ألا نضطر أبدًا إلى استخدام ذلك؛ لكن علينا أن نكون على استعداد دائم». 

أسئلة للمناقشة: 

-١‏ ما التحديات التي كانت تواجهها مدينة كاري؟ 

۲- ما الحل الذي تمّ اقتراحه؟ 

"- ماذا كانت النتائج؟ 

ع- ما المشكلات الأخرى وحلول تحليل البيانات التي تتوقعها مدن مثل كاري؟ 
Source: "Municipality puts wireless water meter-reading data to work (SAS*‏ 
Analytics) - The Town of Cary, North Carolina uses SAS Analytics to analyze‏ 
data from wireless water meters, assess demand, detect problems and engage‏ 


customers.” Copyright © 2016 SAS Institute Inc., Cary, NC, USA. Reprinted 


with permission. All rights reserved. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yor‏ 


الفصل الثاني 


أسئلة مراجعة على القسم :0-١‏ 

-١‏ ما العلاقة بين الإحصاءات وتحليلات الأعمال؟ 

Lo -Y‏ الفروق الأساسية بين الإحصاء الوصفي والاستنتاجي؟ 

-٠‏ اذكر وعرّف باختصار مقاييس النزعة المركزية للإحصاءات الوصفية. 

-٤‏ اذكر وعرّف باختصار مقاييس التشتّت للإحصاءات الوصفية. 

-٥‏ ما هو مخطط الصندوق وطرفيه؟ وما هي أنواع المعلومات الإحصائية التي يمثلها؟ 
5- ما هي خصائص الشكل الأكثر شيوعًا لوصف توزيع البيانات؟ 


1-۲ نمذجة الانحدار للإحصاءات الاستدلالية: 

رها يكون الانحدار - وخاصةً الانحدار الخطي - هو أوسع تقنيات التحليلات شهرةً وأكثرها 
استخدامًا في الإحصاءات. وتعود جذور الانحدار تاريخيًا إلى عشرينيات وثلاثينيات القرن العشرين» 
والتي بدأت بالعمل المبكر على الخصائص الموروثة للبازلاء الحلوة من قبل السَّير فرانسيس جالتون 
ومن بعده كارل بيرسون. ومنذ ذلك الحين؛ أصبح الانحدار هو التقنية الإحصائية لتوصيف 
العلاقات بين المتغير/ المتغيرات التفسيرية (مدخلات) ومتغير/ متغيرات الاستجابة (مُخرجات). 

كما هو الحال في الأساس؛ فإن الانحدار هو تقنية إحصائية بسيطة نسبيًا لنمذجة تبعية متغير 
(الاستجابة أو المخرجات) إلى متغيّر تفسيري واحد أو أكثر (مدخلات). وبمجرد تحديدها؛ يمكن تمثيل 
هذه العلاقة بين المتغيرات بشكل رسمي على أنها دالة خطية/ مضافة أو على أنها معادلة خطية/ مضافة. 
وكما هو الحال مع العديد من تقنيات النمذجة الأخرى؛ يهدف الانحدارٌ إلى التعرّف على العلاقة الدالية 
فيما بين خصائص العام الحقيقي ووصف هذه العلاقة بنموذج رياضيء والذي قد يُستَخدّم بعد ذلك 
لكشف وفهم تعقيدات الواقع واستكشاف وشرح العلاقات أو التنبة بالحوادث المستقبلية. 

ويمكن استخدام الانحدار لواحد من غرضين: الأول هو اختبار فرضية أو استقصاء العلاقات 
المحتملة بين المتغيرات المختلفة: والثاني تقدير التنبؤ بقيم متغيرات الاستجابة £s‏ على متغير 
تفسيري واحد أو أكثر. ولا يقوم أحد هذين الاستخدامين مقام الآخر؛ إذ تُعَذ القوة التفسيرية 
للانحدار هي أيضًَا الأماس لقدرتها على التنبؤ. ففي اختبار الفرضية (بناء النظرية)؛ يمكن أن 
يكشف تحليل الانحدار عن وجود/ قوة واتجاهات العلاقات بين عدد من المتغيّرات التفسيرية 
Sole ly 57535)‏ بالرمز < «أو س») ومتغير الاستجابة (ويرمز له عادةً بالرمز نز «أو ص»). أما 


yot‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية» تصوير البيانات 


في التنبؤ؛ فيُحدّد الانحدار العلاقات الرياضية المضافة (في شكل معادلة) بين واحد أو أكثر من 

المتغيرات العفسيرية :ومتغير الاستجابة. ومجرة odi ado‏ اللعادلة؛ وكون قن المفكن استخدامها 

للتنبق بقيم متغير الاستجابة لمجموعة معينة من قيم المتغيرات التفسيرية. 

- الارتباط مقابل الانحدار: ولأن تحليل الانحدار نشأ من دراسات الارتباطء ولأن كلتا الطريقتين 
تحاولان وصف العلاقة بين متغيرين (أو أكثر)؛ فإن هذين المصطلحين غالبًا ما يتم الخلط بينهما من 
قبل المتخصصين وحتى العلماء. لا يضع الارتباط افتراضاً بديهياً لتبعية أحد المتغيرات لمتغير آخر من 
عدمه» كما لا يهتم بالعلاقة بين المتغيرات؛ ولكنه بدلًا من ذلك يُعطي تقديرًا على درجة الارتباط بين 
المتغيرات. وعلى الجانب الآخر؛ يحاول الانحدارٌ أن يَصف تبعية متغير الاستجابة لواح (أو أكار) 
من المتغيرات التفسيرية؛ إذ يفترض ضمنيًا أن هناك تأثيراً سببياً أحادي الاتجاه من المتغير التفسيري 
(أو المتغيرات التفسيرية) إلى متغير الاستجابة» بغض النظر عمًا إذا كان مسار التأثير مباشرًا أو غير 
مباشر. أيضًا وعلى الرغم من أنَّ الارتباط يهتم بالعلاقات ذات المستوى المنخفض بين متغيرين؛ فإنَّ 
الانحدار يختصٌ بالعلاقات بين جميع المتغيرات التفسيرية ومتغير الاستجابة. 

- الانحدار البسيط مقابل الانحدار المتعدد: إذا تمَّ بناءٌ معادلة الانحدار بين متغير استجابة واحد 
ومتغير تفسيري واحد؛ عندئذ يُطلق عليه الانحدار البسيط. فعلى سبيل المثال: Holes ÅS‏ 
الانحدار التي بُنيّت بغرض توقع/ شرح العلاقة بين طول شخص (التغير التفسيري) ووزنه 
(متغير الاستجابة) مثالًا جيدًا على الانحدار البسيط. أمّا الانحدار المتعدد: هو امتدادٌ للانحدار 
البسيط؛ إذ تكون المتغيّرات التفسيرية أكثر من واحد (أو) أكثر من متغير. فعلى سبيل ال مثالء 
وفي نفس المثال السابق: إذا كنا لن نعتمد فقط على طول الشخص للتنبؤ بوزنه بل سنأخذ أيضاً 
في الاعتبار الخصائص الشخصية الأخرى (مثل: مؤشر مجموعة الجسم الجنس» العزق)؛ فإننا 
في هذه الحالة سنقوم بإجراء تحليل الانحدار المتعدد. وفي كلتا الحالتين؛ تكون العلاقة بين 
متغير الاستجابة والمتغير التفسيري (المتغيرات التفسيرية) علاقة خطية ومضافة بالطبيعة. أما 
إذا كانت العلاقات غير خطية؛ فقد نحتاج إلى استخدام واحدٍ من العديد من طرق الانحدار غير 
الخطية الأخرى؛ للوصول بصورة أفضل للعلاقات بين متغيرات المدخلات والمخرجات. 

كيف نطوّر نموذج الانحدار الخطي؟ 

لفهم العلاقة بين متغيرين؛ فإن أبسط شيءٍ يمكن القيام به هو رسم مخطط تبعثر؛ إذ يمثل 


المحور لا (أو ص) قيم متغير الاستجابة» وهثل ا محور × (أو س) قيم المتغير التفسيري (انظر: 
الشكل .)١1-7‏ سيقوم مخطط التبعثر بإظهار التغيّرات في متغير الاستجابة كدالة للتغيرات في 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 100 


الفصل الثاني 


المتغير التفسيري. يُوضّح الشكل ٠١-۲‏ وجود علاقة طردية بين الاثنين؛ فكلما زادت قيم المتغير 
التفسيري؛ زادت قيم متغير الاستجابة. 





_ × المتغير التفسيري 


شكل ۲-۱۳: مخطط تبعثر وخط انحدار خطي 

يهدف تحليل الانحدار البسيط إلى إيجاد تمثيلٍ رياضي لهذه العلاقة. وفي الواقع؛ فهو يحاول 
العثور على أيّ دلالة لمرور خط مستقيم بشكلٍ صحيح بين النقاط المرسومة (والتي تمثل البيانات 
التاريخية/ الملاحظة) بطريقة تقلل من المسافة بين النقاط والخط (القيم المتوقعة على خط 
الانحدار النظري). وعلى الرغم من وجود عدة طرق/ خوارزميات مقترحة لتحديد خط الانحدار؛ 
فإن الطريقة الأكثر شيوعًا في الاستخدام تُسمَّى طريقة المربعات الصغرى العادية (01:5). تهدف 
طريقة 01:5 إلى تخفيض مجموع المربعات المتبقية (تربيع المسافات الرأسية بين الملاحظة ونقطة 
الانحدار) وتؤدي إلى تعبير رياضي للقيمة التقديرية لخط الانحدار (والتي تُعرف باسم معلمات 
). وبالنسبة للانحدار الخطي البسيط؛ يمكن إظهار العلاقة المذكورة أعلاه بين متغير الاستجابة 
(() والمتغير التفسيري () كمعادلة بسيطة كما يلي: 


عد 8 + y= B,‏ 
في هذه المعادلة؛ يُسمَّى (80) التقاطع؛ ويُسمَّى (81) الميل. وبمجرد أن تقوم 01:5 بتحديد 


قيم هذين ا معاملين؛ يكون من الممكن استخدامٌ المعادلة البسيطة للتنبؤ بقيم ر من قيم × المعطاة. 
وتكشف العلامة وقيمة (81) أيضًا اتجاه وقوة العلاقة بين كلا المتغيرين. إذا كان النموذج من 


10 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية: تصوير البيانات 


نوع انحدار خطي متعدد؛ فسيستلزم الأمر تحديد مزيد من المعاملات؛ بحيث يكون هناك معاملٌ 
dels‏ لكلّ متغير تفسيري إضافي. وكما توضّح الصيغة التالية؛ سوف يتم ضرب المتغير التفسيري 
الإضافي مع معاملات (81) الجديدة ويتم جمعها معًا؛ لإنشاء تمثيل جمعي خطي متغير الاستجابة. 


7 B, BA * By + By +. B, 
كيف نعرف ما إذا كان النموذجٌ جيدًا بما فيه الكفاية؟‎ 

لعدة أسباب متنوعة لا تمثل النماذج في بعض الأحيان الواقع بصورة جيدة: وبغض النظر 
عن غدة أبلتغيراث التفسيرية المُستخدّمة في النموذج: دائماً هناك إمكانيةٌ للحصول على نماذج 
بجودة منخفضة» وبالتالي يجب تقييم نموذج الانحدار الخطي وفقاً لمدى ملاءمته (الدرجة التي 
يمثل بها متغير الاستجابة). بشكل مُبِسَط؛ ينتج عن نموذج الانحدار المناسب قيم تنبؤ تكون 
قريبةٌ من القيم الحقيقية التي ّت ملاحظتها في الواقع. وبالنسبة للتقييم الرقمي؛ غالبًا ما يتم 
استخدام ثلاثة مقاييس إحصائية في تقييم ملاءمة نموذج الانحدار. ۸ (۸ - تربيع)» واختبار :1 
الشامل» وخطأً الجذر التربيعي للوسط الحسابي jirus (RMSE)‏ هذه المقايبس الثلاثة جميعًا 
على مجموع أخطاء المربع (كم تبعد البيانات عن الوسط الحسابيء وكم تبعد البيانات عن القيم 
المتوقعة للنموذج). وتعمل توليفات مختلفة من هاتين القيمتين على توفير معلومات مختلفة 
حول كيفية مقارنة نموذج الانحدار مع نموذج الوسط الحسابي. 

من بين تلك المقايبس الثلاثة يحتوي 82 على المعنى الأكثر فائدةً وفهمًا بسبب كونه مقياسًا 
بديهيًا. تتراوح قيمة ۸ من صفر إلى واحد (المقابل لمقدار التباين الذي يظهر كنسبة مئوية)؛ إذ 
يشير ”الصفر“ إلى أن العلاقة وقوة التنبؤ الخاصة بالنموذج المقترح ليست جيدةً؛ في حين يُعبّر 
«الواحد» عن أن النموذج المقترح مناسبٌ تمامًا وينتج توقعات دقيقة (وهذا لايحدث في الواقع 
مطلقاً). وعادةً ما تكون قيم “8 الجيدة قريبةٌ من الواحد الصحيح» وهذا القرب هو أساس 
الظاهرة التي تم نمذجتها؛ بحيث إذا كانت قيمة 0.3 - *8 لنموذج الانحدار الخطي في العلوم 
الاجتماعية؛ فيمكن اعتبار هذه القيمة جيدة بما فيه الكفايةء أما إذا كانت قيمة 0.7 = ”۸ في 
العلوم الهندسية؛ فهذه القيمة لا تُعَذّ مناسبةٌ بدرجة كافية. ويمكن تحقيق التحسّن في نموذج 
الانحدار عن طريق إضافة متغيرات تفسيرية متسقة» أو استبعاد بعض المتغيرات خارج النموذج» 
أو استخدام تقنيات تحويل بيانات مختلفة؛ مما يؤدي إلى زيادات نسبية في قيمة *1. ويوضح 
الشكل ١6-5‏ عملية تدفق لتطوير نماذج الانحدار. وكما يتبَيّن من عملية التدفق؛ فإنَّ مهمة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yov‏ 


الفصل الثاني 


تطوير النموذج لا بد أن تتبعها مهمة تقييم النموذج؛ إذ لا يقتصر الأمرٌ على ملاءمة النموذج 
الذي تمّ تقييمه فقط؛ ولكن بسبب الافتراضات التقييدية التي يتعيّن على النماذج الخطية الالتزام 
LS dg‏ يجب وضع صلاحية النموذج تحت المجهر. 


چ 
c7‏ 
t‏ 
تقييم البياقات 
Je laa l---‏ 
EMT]‏ 




















شكل :١5-7‏ عملية تدفق تطوير نماذج الانحدار 
ما أهم الافتراضات في الانحدار الخطي؟ 
على الرغم من أنه لا يزال هناك اختيارٌ بين العديد من تحليلات البيانات (سواء لأغراض 
تفسيرية؛ أو لأغراض النمذجة التنبؤية)؛ فإنَّ نماذج الانحدار الخطي تعاني من عدة افتراضات 
شديدة التقييد. وتعتمد صلاحية النموذج الخطي المبني على قدرته على الالتزام بهذه الافتراضات. 
ونعرض فيما يلي أكثر تلك الافتراضات وضوحًا: 


^30 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 




















التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


-١‏ الخطية: BS‏ هذا الافتراض على أن العلاقة بين متغير الاستجابة والمتغيرات التفسيرية هي 
علاقةٌ خطية. مما يعني أن القيمة المتوقعة لمتغير الاستجابة؛ هي دالة خط مستقيم لكل 
متغير تفسيريء مع تثبيت جميع المتغيرات التفسيرية الأخرى. وكذلك لا يعتمد ميل الخط 
على قيم المتغيرات الأخرى. ويعني أيضًا أنَّ تأثيرات المتغيرات التفسيرية المختلفة على القيمة 
المتوقعة للتغير الاستجابة؛ هي تأثيرات مضافة بطبيعتها. 

7- الاستقلالية (للأخطاء): وين هذا الافتراش على أن أخطاء متغير الاستجابة غير مترابطة 
بعضها مع بعض. استقلال الأخطاء أضعف من الاستقلال الإحصائي الفعلي» وهو حالة أقوى 
sss V Ulis‏ هناك لتحليل الانحدار الخطي. 

*- الطبيعية (للأخطاء): وينصٌ هذا الافتراضُ على أن أخطاء متغير الاستجابة تتورّع 
توزيعًا طبيعيا؛ أيْ إنه من المفترض أن تكون عشوائيةً تمامًا ويج ب ألا تمثل أيّ bl‏ 

-٤‏ التباين الثابت (للأخطاء): وهذا الافتراضء والذي يُطلّق عليه أحيانًا (التفاوت المتماثل)» ينضٌُ 
على أن متغيرات الاستجابة يكون لها نفس التباين في خطأهاء بغض النظر عن قيم المتغيرات 
التفسيرية. وعمليَاء؛ لا يكون هذا الافتراض صالحًا إذا اختلف متغيرُ الاستجابة على نطاق/ 
مقياس واسع بما فيه الكفاية. 

-٥‏ الخطية المتعدّدة: وينصٌ هذا الافتراض على عدم وجود ارتباط بين المتغيرات التفسيرية (أيْ: 
إنها لا تكرر نفس النتيجة؛ ولكنها تقدَّم المعلومات المطلوبة للنموذج من منظورٍ مختلف). 
ويمكن تطبيق الخطية المتعددة من خلال تضمين النموذج متغيرين أو أكثر من المتغيرات 
التفسيرية يكون بينها ارتباطً تام (فمثلًا: إذا تمّ تضمينُ نفس اللتغير التفسيري عن طريق 
الخطأ في نفس النموذج مرتين» أو مرةً واحدةً مع تحؤل طفيف من نفس المتغير). وعادةً ما 
يتم اكتشاف هذا الخطأ بواسطة تقييم البيانات المعتمد على الارتباط. 
هناك تقنيات إحصائية تمّ تطويرها تعمل على كسر هذه الافتراضات والتقنيات للتخفيف 

من أثرها. إن الجزء الأكثر أهميةً بالنسبة لمصمّم النماذج هو أن يكون على دراية بوجود وسائل 

تقييم تلك النماذج» وأن يتم وَضْع تلك الوسائل للتأكد من أن النماذج متوافقة مع الافتراضات 
التي يتم بناؤها وفقاً لها 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yos‏ 


الفصل الثاني 


الانحدار اللوجستي: 

يُعرّف الانحدارٌ اللوجستي على أنه خوارزمية تصنيفء لها دلالة إحصائية» مستندة على 
الاحتمالية والتي تستخدم تعلّماً خاضعاً للإشراف. وقد تم تطويره في أربعينيات القرن العشرين 
كمتمم US)‏ من طريقة تحليل الانحدار الخطي وطريقة التمايز الخطي. وقد تمَّ استخدامه على 
نطاقٍ واسع في العديد من التخصّصات» ها في ذلك مجالات العلوم الطبية والاجتماعية. ويتشابه 
الانحدار اللوجستي مع الانحدار الخطي في كونه يهدف كذلك إلى الاعتماد على الدالة الرياضية 
التي تشرح العلاقة بين متغير الاستجابة والمتغيرات التفسيرية باستخدام عينة من ا ملاحظات 
السابقة (بيانات التدريب). ولكنهما يختلفان في نقطة أساسية واحدة: وهي أن مُخرجات 
الانحدار اللوجستي (متغير الاستجابة) تكون فئة في حين تكون مخرجات الانحدار الخطي متغيراً 
رقمياً. بمعنى أنه في الوقت الذي يُستَخدّم فيه الانحدارٌ الخطي لتقدير متغير رقمي مستمر؛ 
يُستَخدّم الانحدارٌ اللوجستي لتصنيف متغير فئوي. وعلى الرّغم من أن الشكل الأصلي من 
الانحدار اللوجستي قد تمَّ تطويره إلى متغير مخرجات ثنائي (مثل: ٠٠ /١‏ نعم/ لاء ناجح/ راسب» 
قبول/ رفض)؛ فإن النسخة المعدَّلة في الوقت الحاضر قادرةٌ على التنبؤق بمتغيرات مخرجات متعددة 
الفئات (أيْ: الانحدار اللوجستي المتعدد الحدود). أمَّا إذا كان هناك متغيرٌ تنبؤ واحدء ومتغير 
توفع واحد؛ فشُسمّى الطريقة هنا الانحدارٌ اللوجستي البسيط (وهي مشابهةٌ لطرق استدعاء 
نماذج الانحدار الخطي مع متغير مستقل واحد فقط كانحدار خطي بسيط). 


في التحليلات التنبؤية؛ يتم استخدامٌ نماذج الانحدار اللوجستي لتطوير نماذج احتمالية بين 
واحد أو أكثر من المتغيرات التفسيرية/ التوقعية (والتي قد تكون مزيجًا من كل من الطبيعة 
المستمرة والفئوية) ومتغير التصنيف/ الاستجابة (والذي قد يكون ثنائياً, ذا حدين أو متعدد 
الحدود/ متعدد الفئات). وعلى عكس الانحدار الخطي الاعتيادي؛ يتم استخدام الانحدار 
اللوجستي؟ للتنبؤ بنتائج فئوية (غالبًا ما تكون ثنائية) لمتغير الاستجابة - معالجة متغير الاستجابة 
كنتيجة لتجربة الاده١إه8.‏ ولذلك؛ يقوم الانحدارٌ اللوجستي بأخذ اللوغاريتم الطبيعي 
لاحتمالات متغير الاستجابة لإنشاء معيار مستمر كنسخة محؤلة لمتغير الاستجابة. وبالتالي يُشار 
إلى تحويل 10816 على أنه دالة الربط في الانحدار اللوجستي - وعلى الرغم من أن متغير الاستجابة 
في الانحدار اللوجستي؛ هو متغيرٌ فئوي أو ثنائي؛ فإن ]1081 هو المعيارٌ المستمر الذي يتم على 
أساسه الانحدار الخطي. ويوضّح الشكل 10-١‏ دالةً الانحدار اللوجستي؛ إذ يتم تمثيل الاحتمالات 
في المحور 9l) x‏ س) (دالة خطية للمتغيرات المستقلة)» في حين تظهر النتيجة الاحتمالية في المحور 
(أو ص) (أَيْ: تتراوح قيم متغير الاستجابة بين ٠‏ و١).‏ 


"e‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية: تصوير البيانات 























6 4 2 0 2 4ه 6 
شكل 10-8: الدالة اللوجستية 


II i‏ اللوجستية. ,(۴) في الشكل ٠-٠١‏ هي صميم الانحدار اللوجستيء والذي لا هكن أن 
يأخذ سوى القيم بين الصفر والواحد الصحيح. وَتُعَدٌ المعادلة التالية تمثيلًا رياضيًا مبسطًا لهذه الدالة: 





يتم عادةً تقديرٌ معاملات الانحدار اللوجستي (55 86]) باستخدام الطريقة القصوى لتقدير 
الاحتمالية. وعلى عكس الانحدار الخطي مع البواقي المورّعة توزيعًا طبيعيًا؛ فإنه ليس من الممكن 
العثورٌ على مصطلح مغلق لقيم المعامل التي ma‏ دالة الاحتمال؛ ولذا ينبغي استخدامٌ عملية 
تكرارية بدلا من ذلك. تبدأ هذه العملية dou‏ مبدئي مؤقت» ثم تقوم راجعة d‏ 
ممعرفة ما إذا كان مكن تحسينٌ الحل وإعادة هذه ال مراجعة التكرارية حتى لا يمكن تحقيق 
تحسّن أو الوصول للحد الأدنى للغاية» وعند هذه النقطة يُقال: إِنَّ العملية قد اكتملت/ و 

كانت التحليلاث الرياضية تحظى بشعبية هائلة. وأصبح استخدامٌ تقنيات التحليلات المبنية 
على البيانات اتجاهًا سائدًا ليس فقط للفرّق الاحترافية؛ بل أيضَّا للرياضات الجامعية والهواة. 
والتحليلات الرياضية تعني استخدام البيانات والتقنيات الإحصائية/ التحليلية لإدارة الفرّق/ 
المنظمات الرياضية على نحو أفضل. sss‏ الحالة العملية 6-١‏ مثالًا على كيفية استخدام مصادر 
البيانات العامة الموجودة والمتاحة بسهولة للتنبؤ بنتائج مباراة في كرة القدم الجامعية باستخدام 
US‏ من نماذج التصنيف وتماذج التنبق بنوع الانحدار. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1 

















الفصل الثاني 


حالة عملية ٤-۲‏ 
توقع نتائج لعبة وعاء 71044 

يكذ التنبؤ بنتيجة لعبة كرة القدم الجامعية (أو أيّ لعبة رياضية أخرى) مشكلة 
مثيرةً للاهتمام ومليئةً بالتحَدّيات. ولذلك؛ فقد بذل هواة التحَدَّي من الباحثين 
سواءً الأكاديميين أو الصناعيين جهدًا عظيمًا في التنبؤ بنتائج الأحداث الرياضية. 
تُوَجَّد كمياتٌ كبيرةً من البيانات التاريخية في منافذ إعلامية مختلفة (غالبًا ما تكون 
معلنةً) فيما يتعلّق بهيكل ونتائج الأحداث الرياضية في شكلٍ مجموعة متنوعة من 
العوامل التي يتم تمثيلها عدديًا أو رمزيًا والتي يفترض أنها تُسهم في تلك النتائج. 
ola sleg i$‏ نهاية الموسم في غاية الأهمية بالنسبة للكليات من الناحية 
المالية (لتحقيق عائد إضافي يصل لملايين الدولارات) بالإضافة إلى السّمعة؛ وذلك 
بغرض ضم الطلاب المتفوقين والرياضيين أصحاب التقديرات الكبيرة على برامجهم 
الرياضية في أثناء مرحلة الدراسة الثانوية (2016 (Freeman & Brewer,‏ تقوم 
الفرق التي يتم اختيارها للتنافس في وعاء لعبة معينة باقتسام الجائزة المالية, 
ner‏ يعتمد على ذلك الوعاء لكل منهم (بعض الأوعية تكون أكثر فخامةً وذات 
دفعات أعلى للفريقين)؛ ولذلك يُحَدٌّ ضمان دغوة إلى Les‏ اللعبة؛ هو الهدق 
الرئيسي لأيّ برنامج كرة قدم لقسم 1-4 بالكلية. ويتمٌ مَنْحِ متخذي القرارات 
لألعاب الوعاء صلاحيةً اختيار ودعوة الجمهور المستحق (فريق لديه ستة 
انتصارات ضد خصومه في القتسم 1-4 في ذلك الموسم) للفرّق الناجحة (حسب 
التقديرات والتصنيفات العالمية) التي ستلعب المباراة بشكل مثيرٍ وتنافسيء مع 
الحفاظ على ما تبقى من ا مشجّعين المنضبطين عبر منافذ الإعلام المتنوعة. ds‏ 
دراسة حديثة حول التنقيب في البيانات؛ استخدم Cogdells Delen (a ds‏ 
glè Kasapg‏ سنوات من بيانات لعبة 0081 إلى جانب ثلاث تقنيات شائعة 
للتنقيب في البيانات (أشجار القرارء والشبكات العصبية» وآلة المتجهات الداعمة)؛ 
للتنبؤ بكلّ من نتائج تصنيف إحدى الألعاب (الفوز مقابل الخسارة)؛ فضلًا عن 
النتيجة من نوع الانحدار (فرق النقاط المسقطة بين درجات الخصمين). وفيما 
يلي وصفٌ مختصرٌ لدراستهم تلك. 


vw‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصقية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 











ال منهجية: 

في هذا البحث؛ اتبع دلين وزملاؤه منهجيةً واسعة الانتشار في التنقيب في 
CRISP-DM p—s OLLI‏ (عملية قياسية عبر الصناعة لتعدين البيانات)» 
وهي عمليةٌ من ست خطوات. Cibo a5‏ هذه المنهجية المشهورة والتي Gea‏ 
تناولها بالتفصيل في الفصل cul JI‏ طريقة منهجية ومنظمة لإجراء دراسة التنقيب 
في البيانات الأساسية؛ ومن ثم زادت من احتمالية الحصول على نتائج دقيقة 
وموثوقة. ولتقييم قوة التنبؤ لأنواع النماذج المختلفة بموضوعية؛ قاموا باستخدام 
منهجية للتحقق من الفاعلية» والتي ثُسمّى س-أجزاء .(K-folds)‏ ويمكن الاطلاع 
على تفاصيل منهجية 1-1014 في الفصل الرابع. ويوضّح الشكل 11-9 بيائيًا 
اللنهجية المستخدّمة من قبل الباحتين: 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ur‏ 








الفصل الثاني 











شكل 15-7: الرسم التوضيحي للمنهجية المستخدمة في الدراسة 
اقتناء ومعالجة البيانات: 


تم جمعٌ بيانات العينة لهذه الدراسة من مجموعة متنوعة من قواعد 
البيانات الرياضية ال متاحة على الویب« ما في ذلك ESPN.com; jhowel.net‏ 
و Covers.com‏ وncaa.org‏ وusstreet.comاuuها.‏ تضمّنت مجموعة البيانات 
e gamo Ji lylo YEE‏ كاملةً من نمانية مواسم من مباريات كرة القدم الجامعية 
التي تم لعبها بين عامي ۲۰۰۲ و۹١٠۲م.‏ وقد قمنا أيصًا بتضمين مجموعة بيانات 
خارج العينة (ألعاب ١٠١۲-٠٠١۲م)؛‏ للحصول على أغراض فاعلية إضافية. وقد 


ME‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


تمّ استخدامٌ بديهية واحدة من البديهيات الرائجة في التنقيب في البيانات» وقاموا 
بتضمين الكثير من المعلومات ذات الصّلة في النموذج قدر الإمكان. لذلك؛ فبعد 
عملية متعمقة لتحديد وتجميع المتغير انتهى بهم الأمرٌ إلى مجموعة بيانات 
شملت ١‏ متغيرا كانت أول " متغيرات منها تتعلّق بتحديد الهوية (أيْ: اسم 
وتاريخ ال مباراةء وأسماء الفرق» صاحب الأرض والضيف» ومؤتمراتهم الرياضية - 
انظر: المتغيرات من ١‏ إلى ٦‏ في الجدول 0-۲)» ثم يتبعهم ۲۸ متغيرًً للمدخلات 
(تضمَّت متغيرات لتحديد الإحصاءات الموسمية للفريق بشأن الهجوم والدفاع 
ونتائج المباريات» وخصائص تكوين الفريق» وخصائص ال مؤتمرات الرياضيةء وكيف 
نجحوا في تحَطَّي الصعاب - انظر: ا متغیرات من ۲٤ JI V‏ في الجدول 0-۲)» وأخيرًا؛ 
كان آخرٌ اثنين من المتغيرات Ca» - WinLosss ScoreDiff a5) cole xU‏ 
يعني :560561118 فرق النقاط بين الفريق صاحب الأرض والفريق الضيف ممثلةٌ 
بعددٍ صحيح: في حين يشير 117151:055 إلى فوز أو خسارة الفريق صاحب الأرض 
للعبة الوعاء وا ممثلة بعلامة اسمية). 

في صياغة مجموعة البيانات؛ قام كل Aul äl a.k.a. tuple) a‏ 
المثال... إلخ) بتمثيل لعبة وعاءء واختص كل عمود بمتغير (أيْ: نوع المتغير معرف/ 
مدخلات أو مخرجات). ولتمثيل الخصائص النسبية المرتبطة باللعبة للفريقين 
المتنافسينء في متغيرات المدخلات؛ قمنا بحساب واستخدام الفروق بين مقاييس 
الفريق صاحب الأرض والفريق الضيف. ويتمُ حسابٌ كلّ قيم المتغير هذه من 
منظور الفريق صاحب الأرض. على سبيل المثال: يمثل المتغير ۴۴6 (متوسط عدد 
النقاط التي سجلها الفريق في كل مباراة) الفرق بين ال 550 للفريق صاحب 
الأرض وال 2856 للفريق الضيف. LÉ‏ متغيرات المخرجات فوز أو خسارة 
الفريق صاحب الأرض للمباراة. بمعنى؛ لو يأخذ متغير :56016514 رقمًا صحيحًا 
موجبًا؛ فمن المتوقع أن يفوز الفريق صاحب الأرض باللعبة بهذا الهامشء وإلا 
xs)‏ لويأخذ المتغير :56051011 رقمًا صحيحًا سالبًا) فعندئذ نتوقع أن يخس 
الفريق صاحب الأرض اللعبة بهذا الهامش. 3( WinLoss ilo‏ تكون قيمة متغير 
المخرجات عبارة عن تسمية ثنائية» ”هذللا“ أو ”1.055“ وهي تشير إلى نتيجة 
اطباراة بالنسبة للفريق صاحب الأرض. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yo‏ 


الفصل الثاني 


النتائج والتقييم: 

في هذه الدراسة؛ يتخ استخدامٌ ثلاث تقنيات تنبؤ رائجة لبناء النماذج 
(ومقارنتها بعضها مع بعض): الشبكات العصبية الاصطناعية» وأشجار القران 
وآلة المتجهات الداعمة. ويتمٌ اختيار تقنيات التنبؤ هذه وفقاً لقدرتها على نمذجة 
US‏ من التصنيفات إضافةً إلى مشكلات التنبق من النوع الانحداري وانتشارها 
في أدبيات التنقيب في البيانات المنشورة حديئًا. ويمكن العثور على مزيدٍ من 
التفاصيل حول طرق التنقيب في البيانات الشائعة هذه في الفصل الرابع. 

لمقارنة الدقة التنبؤية لجميع النماذج بعضها ببعض؛ استخدم الباحثون 
منهجية التحقق المتقاطع الطبقي 1014->1. في النسخة الطبقية من 1014ل 
يتم إنشاء الطبقات بطريقة تحتوي على نفس النسبة تقريبًا من علامات التنبؤ 
(أيْ: الطبقات) كما في مجموعة البيانات الأصلية. وفي هذه الدراسة؛ يتم وَضْعَ 
قيمة 10 -؟! (أيْ: يتم تقسيم المجموعة الكاملة المكوّنة من 66" عينة إلى ٠١‏ 
مجموعات فرعية» بكلٌ منها 10 عينة تقريبًا/» والذي يُعَذُ ممارسةً شائعةً في 
تطبيقات التنقيب عن البيانات التنبؤية. وقد سبق توضيح 1-1011 برسم بياني 
قبل ذلك في هذا الفصل. ومقارنة نماذج التنبؤ التي تمَّ تطويرها باستخدام clas‏ 
التنقيب الثلاث المذكورة «al‏ فقد استقرٌ الباحثون على استخدام ثلاثة معايير أداء 
شائعة الاستخدام» هي: الدقةء والحساسيةء والخصوصية. كما تمَّ شرح المعادلات 
البسيطة لهذه المقاييس في وقتِ سابق في هذا الفصل. 


جدول 0-7: وصف للمتغيرات ال مستخدمة في الدراسة 


El e‏ إسم المتغير الوصف 

YEAR | ID| 1‏ سنة لعبة الوعاء 

BOWLGAME| ID| 2‏ اسم لعبة الوعاء 

HOMETEAM | ID| 3‏ القريق صاحب الأرض (كما هو 345 من قبل منظمي الوعاء) 
AWAYTEAM | ID| 4‏ الفريق الضيف (كما هو مُدرّج من قبل منظمي الوعاء) 

5 |12 | 110118001188818 | مؤتمر الفريق صاحب الأرض 

















"m‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 























20 


21 


22 


23 


24 


25 


26 


27 


28 


39 


30 


31 








11 
11 
11 
11 
11 
11 
12 
12 
12 
12 
12 
12 


12 
12 
13 
13 
13 
13 
13 
14 
14 
14 
14 


14 





التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائيةء تصوير البيانات 


إسم المتغير 
AWAYCONFERENCE‏ 
DEFPTPGM‏ 
DEFRYDPGM‏ 
DEFYDPGM‏ 
PPG‏ 
PYDPGM‏ 
RYDPGM‏ 
YRDPGM‏ 
XHMWIN‏ 
LAST7‏ 
MARGOVIC‏ 
NCTW‏ 
PREVAPP‏ 
XRDWIN‏ 


SEASTW 
TOP25 
TSOS 

XFR 

70 

XJR 

XSR 
XSEASOvUn 
XATSCOV 
XUNDER 
XOVER 
XSEASATS 





الوصف 

مؤتمر الفريق الضيف 

نقاط دفاعية لكل مباراة 

ساحات الاندفاع الدفاعية لكل مباراة 

ساحات دفاعية لكل مباراة 

متوسط عدد النقاط التي سجلها فريقٌ معين في كلّ مباراة 
متوسط عدد التمريرات الميدانية الإجمالي لكل مباراة 
متوسط إجمالي عدد مرات الفوز في كلّ فريق لكل مباراة 
متوسط عدد الهجمات الميدانية لكل مباراة 

نسبة الفوز الرئيسية 

كم عدد المباريات التي فاز بها الفريق من آخر ‏ مباريات 
متوسط هامش الفوز 

نسبة فوز فريق Nonconference‏ 

هل ظهر الفريق في مباراة في العام الماضي 

نسبة الفوز على الطريق 

نسبة الفوز للسنة 

الفوز نسبة ضد أعلى 0! فريق 47 للسنة 

قوة الجدول الزمني للسنة 

نسبة المباريات التي يلعبها لاعبو الصف الأول في السنة 
نسبة المباريات التي يلعبها لاعبو الصف الثاني في السنة 
نسبة المباريات التي يلعبها اللاعبون الأحدث سنًا لهذا العام 
النسبة المئوية للألعاب التي لعبها لاعبون من الدرجة الأولى خلال العام 
نسبة المرات التي مَرِّ فيها الفريق على 0/17* في الموسم الحالي 
مقابل نسبة تغطية انتشار الفريق في المباريات السابقة 
النسبة المئوية لمرات انهيار الفريق في المباريات السابقة 
نسبة المرات التي اجتازها الفريق في مباريات سابقة 

نسبة التغطية مقابل الانتشار للموسم الحالي 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





yw 
















































































الفصل الثاني 


MA 

















م |الفتة إسم المتغير الوصف 

CONCH | 152‏ هل فاز الفريق ببطولة المؤتمر الخاصة بهم؟ 

CONFSOS| I5|33‏ قوة المؤتمر من الجدول الزمني 

XCONFWIN| 15 | 4‏ نسبة الفوز في المؤتمر 

ScoreDiffo | O1 | 35‏ فرق النقاط (نقاط صاحب الأرض - نقاط الضيف) 

WinLosso | O2 | 36‏ ما إذا كان الفريق صاحب الأرض يفوز أو يخسر اللعبة 


* 0/1 - ما إذا كان الفريق سيخترق أو يقل عن فرق النقاط المتوقعة. 
© متغيرات الإخراج: WinLosss jla29MI e3la: ScoreDiff‏ لنماذج التصنيف الثنائية. 
1]: المخالفة/ الدفاع؛ 12: نتيجة اللعبة؛ 13: تكوين الفريق؛ 14: ضد الصعاب؛ 15: إحصائيات المؤتمر. 


Cole :ID‏ تحديد الهوية؛ 01©: متغير المخرجات لنماذج الانحدار؛ 02: متغير المخرجات لنماذج التصنيف. 


ويتمٌ تقديمٌ نتائج التنبؤ لتقنيات النمذجة الثلاث في الجدول 7-١‏ والجدول 
۷-۲ إذ يعرض الجدول 1-۲ نتائج الفاعلية المتقاطعة من ٠١‏ أضعاف لمنهجية 
التصنيف؛ إذ تتم صياغة تقنيات التنقيب في البيانات الثلاثة؛ بحيث يكون لها 
متغير مُخرجات ثنائي التسمية (أيْ: (WinLoss‏ في حين يُقدَّم الجدول ۷-۲ 
نتائج الفاعلية المتقاطعة من ٠١‏ أضعاف للنهجية التصنيف المستندة إلى الانحدار؛ 
إذ نُصاغ تقنيات التنقيب في البيانات الثلاثة؛ بحيث يكون لها متغير مخرجات 
رقمي (أَيْ: 5606511). في التنبؤ بالتصنيف القائم على الانحدار؛ يتم تحويلٌ 
ا مخرجات العددية للنماذج إلى تصنيفات عن طريق وَضْع علامة ”م1871“ على أرقام 
85 الوجبة وعلامة "Loss"‏ على أرقام 5 السالبة» ثم جدولة ذلك 
كله في مصفوفات الارتباك. باستخدام مصفوفات الارتباك؛ يتم حساب دقة التنبؤ 
الشاملةء والحساسيةء والنوعية لكل نوع من أنواع النماذج وعرضها في هذين 
الجدولين. وكما تشير النتائج؛ فإن أساليب التنبؤ من نوع التصنيف تؤدي بصورة 
أفضل من منهجية التنبؤ من نوع التصنيف القائم على الانحدار. ومن بين تقنيات 
التنقيب في البيانات الثلاثة؛ أنتجت أشجارٌ التصنيف والانحدار دقةٌ تنبؤية أفضل 
US d‏ من منهجيتي التنبؤ المُشار إليهما. وبشكل عام؛ أنتجت نماذج التصنيف 
ونماذج شجرة الانحدار لمنهجية الفعالية المتقاطعة ٠١‏ أضعاف نسبة دقة تصل إلى 
۸ تليها آلة المتجهات الداعمة بنسبة دقة تصل إلى “175:0١‏ ثم الشبكات 
العصبية بنسبة دقة تصل إلى ۷0. وباستخدام t Jus‏ وجد الباحثون أَنَّ قيم 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 























التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


الدقة هذه كانت مختلفةٌ بشكل معنوي عند مستوى ألفا .0.٠0‏ أي إِنَّ شجرة 
القرارات a‏ مؤْشّرًا أفضل بشكل معنوي لهذا النطاق من الشبكة العصبية وآلة 
نقل الدعم» وأيضًا آلة نقل الدعم تُعَد مؤشرًا أفضل بكثير من الشبكات العصبية. 


جدول 1-7: نتائج التنبؤ لمنهجية التصنيف المباشر 
































طريقة التنبؤ مصفوفة الارتباك الحساسية | الخصوصية 
(تصنيف *) فوز (x) (x)‏ 
ANN (MLP)‏ فوز WT VO,» | £Y aY‏ لام 
خسارة M‏ ۹ 
SVM (RBF)‏ فوز 10 VAT ۷1,01 | Ys‏ ۸۰۹۱ 
خسارة Y‏ ^ | 
DT (C&RT)‏ فوز A&YY MEA | » Wr‏ ۸4,۰۹ 
خسارة w‏ ^3 | 
* متغير المخرجات: هو متغير فئوني ثنائي (1018 أو 1.055)؛ كانت الفروق معنوية. 
P001 **‏ 
جدول "-/!: نتائج التنبؤ ul‏ التصنيف القائم على الانحدار 
طريقة التنبؤ مصفوفة الارتباك 
الدقة ** | الحساسية | الخصوصية 
(قائم على الانحدار*) فوز | خسارة 
ANN (MLP)‏ فوز FERT vY,ot | £s at‏ ,20> 


| ^r Yv خسارة‎ 
V£,o0 Ver V£,o8 ve ye فوز‎ SVM (RBF) 
AY YA DIN 


1,1۰ vun WAV | YA vI j$ DT (C&RT) 























| ^É n خسارة‎ 


* متغير المخرجات هو متغير رقمي/ عدد صحيح (فرق النقط)؛ كانت الفروق معنوية. 


.P «0.01 ** 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1 


















































الفصل الثاني 


وقد أظهرت نتائجُ الدراسة أنَّ نماذج التصنيف النوعية تتنبأ بنتائج اللعبة 
بشكلٍ أفضل من نماذج التصنيف القائمة على الانحدار. وعلى الرغم من أَنَّ هذه 
النتائج خاصة بالنطاق العملي والبيانات المستخدّمة في هذه الدراسة. وبالتالي 
لا ينبغي تعميمها خارج نطاق الدراسة؛ فهي مثيرة؛ وذلك لأن أشجار القرار 
ليست الأفضل في التنبؤ فحسب ولكن أيضًا هي الأفضل في الفهم والنشرء مقارنة 
مع التقنيتين الأخرتين لتعلّم الآلة المستخدمتين في هذه الدراسة. ومكن العثور 
على مزيد من التفاصيل حول هذه الدراسة في (هعاء12 وآخرون 0017. 
أسئلة للمناقشة: 
-١‏ ما هي التحديات المتوقعة في التنبؤ بنتائج الأحداث الرياضية (على سبيل 
المثال: ألعاب مباراة الكلية)؟ 
۲- كيف قام الباحثون بصياغة/ تصميم مشكلة التنبؤ (أيّ: ما هي المدخلات 
وا مخرجات؟ وماذا كان تمثيل عينة واحدة - صف بيانات؟) 
"- ما مدى نجاح نتائج التنبؤ؟ وما الذي يمكنهم فعله لتحسين الدقة؟ 
Sources: Delen, D., Cogdell, D., & Kasap, N. (2012). A compara- tive analysis of‏ 


data mining methods in predicting NCAA bowl outcomes. International Journal of 


Forecasting, 28, 543-552; Freeman, K. M., & Brewer, R. M. (2016). The politics of 


American college football. Journal of Applied Business and Economics, 18(2), 97-101. 


التنبؤ بالسلاسل الزمنية: 

في بعض الأحيان قد لا يكون للمتغير الذي نحن بصدد دراسته (أيْ: متغير الاستجابة) متغيرات 
تفسيرية واضحة المعالم أو قد يكون هناك الكثيرٌ منها في علاقة مُعقدة للغاية. في مثل هذه 
الحالات؛ إذا كانت البيانات متاحةً في الشكل المطلوبء فيمكن تطوير نموذج التنبؤء والذي يُسمَّى 
dl uL]‏ الزمنية:. عرف السلسلة الزمتية:غلى 'أنها سلسلةٌ من نقاط البيافنات للمتغير محل 
الاهتمام» ويتم قياسها وتمثيلها في نقاط متتالية في الوقت متباعدة في فواصل زمنية مُوخّدة. ومن 
أمثلة السلاسل الزمنية أحجام الأمطار الشهرية في منطقة جغرافية ماء وقيمة الإغلاق اليومي 
مؤشرات سوق الأوراق المالية ومجموع المبيعات اليومية لمحل بقالة. وفي كثيرٍ من الأحيان؛ يتم 
تصوير السلسلة الزمنية باستخدام منحنى خطي. ويُوضّح الشكل 17-7 مثالا لسلسلة زمنية 
لحجم المبيعات للسنوات من ۲۰۰۸ حتى 7٠١17‏ على أساس ربع سنوي. 


Ww.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


يُعرف التنبؤ بالسلسلة الزمنية على أنه استخدامٌ النمذجة الرياضية للتنبؤ بالقيم المستقبلية 
للمتغير محل الاهتمام بناءً على القيم التي تم رصدها من قبل. تبدو مخططات/ جداول السلاسل 
الزمنية مشابهةً جداً للانحدار الخطي البسيط في ذلك كما كان الحال في الانحدار الخطي البسيطء 
في السلسلة الزمنية يُوجَّد متغيران: متغير الاستجابة» ومتغير الوقت ال معروض في مخطط مبعثر. 
وبخلاف هذا التشابه؛ لا يكاد يكون هناك أي قواسم مشتركة أخرى بين الاثنين. وعلى الرغم من 
i‏ تحليل الانحدار يتم توظيفه في اختبار النظريات؛ لمعرفة ما إذا كانت القيمٌ الحالية لواحدٍ أو 
أكثر من المتغيرات التفسيرية تفسر (وبالتالي تتنبأ ب) متغير الاستجابة؛ فإن نماذج السلاسل الزمنية 
تركز على الاستقراء على سلوكها المتغير مع الوقت لتقدير القيم المستقبلية. ويفترض التنبؤ 
بالسلاسل الزمنية أن جميع المتغيرات التفسيرية يتم تجميعها واستهلاكها في دراسة سلوك اختلاف 
الوقت بلتغير الاستجابة. ولذلك؛ فإن اكتشاف سلوك تغيّر الوقت؛ هو طريقة للتنبؤ بالقيم 
المستقبلية لمتغير الاستجابة. وللقيام بذلك؛ يتم اختصارٌ النمط وتحليله إلى مكوناته الرئيسية: 
الاختلافات العشوائية: والاتجاهات الزمنية» والدورات الموسمية. ويوضّح مثال السلاسل الزمنية 
المعروض في الشكل 1٠-7‏ كلّ هذه الأنماط المميزة. 


Quarterly Product Sales (in Millions) 





Q1 Q2 03 Q4|Qi Q2 Q3 O4|Q! Q2 Q3 Q4|Q! 02 Q3 Q4 Q1 02 03 4 














2012 2011 2010 2009 2008 
شكل 11-7: سلسلة زمنية للبيانات عن أحجام المبيعات ربع السنوية 
وتتراوح التقنيات المُستخدّمة في تطوير تنبؤات التسلسل الزمني من بسيطة جدًا (مثل التنبق 
البسيط الذي يقترح أن يكون الفعلي بالأمس هو المتوقع اليوم) إلى معقد جدًا مثل 1111/4 
(وهي iib‏ تجمع بين أنماط المتوسطات المنحدرة والمتحركة في البيانات). وربما تكون التقنيات 
الأكثر شيوعًا؛ هي طرقٌ إيجاد المعدلء والتي تتضمّن المتوسط البسيط والمتوسط المتحركء والمتوسط 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wi‏ 








الفصل الثاني 


المتحرك المرجح. والتضخيم الأسي. كما أنَّ العديد من هذه التقنيات لها إصداراتٌ متقدمةٌ بحيث 
يمكنها أيضًا أن تأخذ في حُسبانها كلا من الموسمية والاتجاه للتنبق بشكل أفضل وأكثر دقة. وعادةً ما 
يتم تقييم دقة الطريقة من خلال حساب خطأها G)‏ الانحراف المحسوب بين الفعليات والتنبؤات 
الخاصة بالملاحظات السابقة) عن طريق الوسط الحسابي للخطأ (MAE) Shll‏ أو الوسط الحسابي 
للخطأ التربيعي (:3155) أو الوسط الحسابي للخطأ المطلق في النسبة eÈ deg (MAPE) ioth)‏ 
من أن جميعهم يستخدمون نفس مقياس الخطأ الأمامي؛ فإنَّ طرق التقييم الثلاث هذه تؤكد 
الجوانب المختلفة للخطأ؛ إذ تقوم بتركيب بعض الأخطاء الكبيرة أكثر من الأخطاء الأخرى. 


أسئلة مراجعة على القسم 1-۲: 

-١‏ ما هو الانحدار؟ وما هو الغرض الإحصائ الذي يخدمه؟ 

؟- ما هي أوجه الشبه والاختلاف بين الانحدار والارتباط؟ 

*- ما هو 01:5؟ وكيف يحدد 01:5 خط الانحدار الخطي؟ 

-٤‏ اذكر مع الشرح الخطوات الرئيسة ممتابعة تطوير نموذج الانحدار الخطي. 

3st ya b -0‏ الافتراضات شيوعًا للانحدار الخطي؟ 

-٦‏ ما هو الانحدار اللوجستي؟ وكيف يختلف عن الانحدار الخطي؟ 

/- ما هي السلاسل الزمنية؟ وما هي تقنيات التنبؤ الرئيسة لبيانات السلاسل الزمنية؟ 


؟-/ إعداد تقارير الأعمال: 

يحتاج صانعو القرار إلى معلوماتٍ لاتخاذ قرارات دقيقة في الؤقت اللتاسب؟ إذ تُعَدٌّ اللعلومات 
في الأساس سياق البيانات. إضافةً إلى الوسائل الإحصائية التي تمّ شرحها في القسم السابق» 
ويمكن أيضًا الحصول على المعلومات (التحليلات الوصفية) باستخدام أنظمة معالجة التحليلات 
عبر الإنترنت [OLTP]‏ (انظر: التصنيف البسيط للتحليل الوصفي في الشكل 7-7). عادةً ما يتم 
تقديم المعلومات إلى صُناع القرار في شكل تقريرٍ مكتوب (رقميا أو ورقيًا) مع وجود إمكانية 
لتقديمه شفويًا أيضًا. وببساطة؛ فإن أيّ تقرير هو عبارة عن أيّ وسيلة اتصال تمَّ إعدادها؛ بغرض 
نقل المعلومات في شكلٍ مقبول إلى كلّ مَنْ يحتاج إليهاء في أيّ وقت وفي أيّ مكان قد يحتاج إليها 
فيه. وعادةً ما يكون التقريرٌ عبارة عن مستندٍ يحتوي على معلومات (عادةً ما تكون مبنيةً على 


2 


البيانات) منظمةً في شكل سرد و/ أو بياني و/ أو مجدول؛ يتم إعدادها بشكلٍ دوري (متناوب) أو 


VY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


على أساس الحاجة (حسب الغرض». بالإشارة إلى فترات زمنية مُحدَّدةء أو أحداث أو حوادث أو 
موضوعات. وبإمكان تقارير الأعمال القيام بالعديد من الوظائف المختلفة (ولكنها غاليًا ما تكون 
ذات صلة بعضها ببعض). وفي ما يلي أمثلةٌ على أكثر هذه التقارير انتشارًا: 
- تقارير التأكد من قيام جميع الإدارات بوظائفها بشكلٍ صحيح. 
- تقارير لتوفير المعلومات. 
- تقارير لتوفير نتائج التحليل. 
aed. s -‏ الكفريق عاق ali‏ 
- تقارير إنشاء ذاكرة تنظيمية (كجزء من نظام إدارة المعرفة). 

يُكَنّ إعداد تقارير الأعمال (والذي يُسمَّى أيضًا 01.47 أو ذكاء الأعمال) جزءًا أساسيًا من أدوات 
القيادة العليا بشأن اتخاذ القرارات الإدارية المثالية المُحسّنة والقائمة على الأدلة. وينظر إلى أساس 
هذه التقارير التجارية على أنها مصادرٌ مختلفة للبيانات القادمة من داخل أو خارج المؤسسة 
(أنظمة معالجة العمليات التجارية عبر الإنترنت [01:18]). ويتضمّن إنشاءٌ هذه التقارير إجراءات 
1 (الاستخراج» والتحويل؛ والتنزيل) بالتنسيق مع مستودع البيانات» ثم استخدام واحد أو أكثر 
من أدوات إعداد التقارير (انظر الفصل Y‏ للحصول على وصف مُفصَّل لهذه المفاهيم). 

وبسبب التوشّع السريع في تقنية المعلومات بجانب الحاجة إلى تحسين القدرة التنافسية في 
قطاع الأعمال؛ فقد حدثت زيادةٌ في استخدام القدرة الحاسوبية لإنتاج تقارير مُوخّدة تنضمٌ إلى 
وجهات نظر مختلفة للمشروع في مكانٍ واحد. وعادةً ما تتضمّن عملية إعداد التقارير هذه 
الاستعلام عن مصادر البيانات المهيكلة: والتي $5 إنشاء معظمها باستخدام نماذج بيانات منطقية 
وقواميس بيانات مختلفة؛ وذلك لإنتاج تقرير يسهل قراءته واستيعابه. كما تسمح هذه الأنواع 
من تقارير الأعمال للمديرين وزملاء العمل بالبقاء على دراية ومشاركة والقدرة على النظر في 
الخيارات والبدائل لاتخاذ قرارات صائبة. ويوضّح الشكل 18-7 دورةً مستمرةً من الحصول 
على البيانات > توليد المعلومات > صُنع القرار > إدارة عمليات الأعمال. ولعل المهمة الأكثر 
حساسيةً في هذه العملية الدورية؛ هي إعداد التقارير (أيْ: توليد المعلومات) - وتحويل البيانات 
من مصادر مختلفة إلى معلومات قابلة للتطبيق. 

إنَّ مفاتيح النجاح لأيّ تقرير هي الوضوح والإيجاز والاكتمال والصواب. وتتغير طبيعة التقرير 
ومستوى أهمية هذه العوامل المؤدية إلى النجاح بشكلٍ كبير بناءً على «ممن يتم توجيه هذه 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wr‏ 


الفصل الثاني 


التقارير؟». يتم توجيه معظم البحوث في التقارير الفعّالة نحو التقارير الداخلية التي تمد أضحاب 
المصلحة وصانعى القرار داخل المنظمة بالمعلومات. وهناك أيضًا تقارير خارجية بين الشركات 
والحكومة (مثل: تقارير لأغراض الضريبة أو للإيداعات المنتظمة إلى لجنة الأوراق المالية والبورصات). 



































Ai 


القرار 














(إعداد تقارير) 


شكل 18-9: دور إعداد تقارير المعلومات في اتخاذ القرارات الإدارية 
وعلى الرغم من وجود تشكيلة عريضة من التقارير التجارية؛ فإنه يمكن تصنيفٌ تلك التي يتم 
استخدامها غالبًا لأغراض إدارية إلى ثلاث .(Hill, 2016) ij cob‏ 


2 


- تقارير إدارية موزونة: في العديد من المؤسسات؛ تتم إدارة أداء الأعمال من خلال مقاييس 
مُوجَّهة باتجاه النتائج. بالنسبة للمجموعات الخارجية؛ تكون هذه الاتفاقيات على مستوى 
الخدمة. أمّا بالنسبة للإدارة الداخلية؛ فتُعَنٌ مؤشرات الأداء الرئيسة (1515). وعادةً ما يكون 
هناك أهدافٌ متفقٌ عليها على نطاق المؤسسة؛ ليتم تعقّبها على مدى فترة زمنية ما. ويمكن 
استخدامها كجزء من إستراتيجيات الإدارة الأخرى مثل 518708 <ذ5 أو إدارة الجودة الشاملة. 

- تقارير من نوع لوحة المعلومات: كانت الفكرةٌ الشائعة في التقارير التجارية في السنوات الأخيرة, 
هي تقديم مجموعة من مؤشرات الأداء المختلفة على صفحة واحدة. مثل لوحة القيادة في 
السيارة. وعادةً ما يوفر منتجو لوحة المعلومات مجموعةً من التقارير المْحَدَّدة مسبقاً بعناصر 
ساكنة وهيكل ثابت» مع السماح آيصًا بتخصيص احتياجات لوحة ال معلومات وطرق العرض 
ووضع أهداف لمقايبس مختلفة. ومن الشائع أن تكون هناك إشارات ضوئية مرورية ملونة 
كإشارات المرور المحدَّدة للأداء (الأحمرء الأصفرء الأخضر)؛ وذلك لتوجيه انتباه الإدارة إلى مناطق 
معينة. وسيتمٌ الخوض بتفاصيل أكثر عن لوحات ال معلومات في جز لاحق من هذا الفصل. 


wt‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 






































التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائية. تصوير البيانات 


- تقارير متوازنة من نوع بطاقات الأداء: قام بتطوير هذه الطريقة «Kaplan and Norton‏ 
وهي طريقةٌ تحاول تقديم رؤية متكاملة للنجاح في أيَّ مؤسسة. وإضافةً إلى الأداء المالي؛ فإنَّ 
التقارير المتوازنة من نوع بطاقات الأداء تتضمّن أيضًا العملاء وعملية الأعمال ووجهات نظر 
للتعلّم والنمو. وسنعرض بممزيدٍ من التفصيل بطاقات الأداء المتوازنة لاحقًا في هذا الفصل. 

تقدّم الحالة العملية ؟-0 مثالًا لتوضيح قوة وفائدة إنشاء التقارير الآلية (وفي وقت من 

الأزمات الطبيعية والفوضوية إلى حَدَّ ما) لمنظمة كبيرة» مثل: 51:1/4. 


حالة عملية ٥-۲‏ 
انتهاء فيضان الورق FEMA i‏ 

حصل الموظفون في وكالة إدارة الطوارئ الفيدرالية (583/4) - وهي وكالةٌ فدرالية 
أمريكية تنسّق الاستجابة للكوارث عندما يعلن الرئيسٌ عن وقوع كارثة وطنية - على 
فيضانين في آنٍ واحد. آولا: غطّت المياه الأرض. بعد ذلك؛ غطّى عددٌ كبِيرٌ من الأوراق 
المطلوبة من جانب إدارة البرنامج الوطني للتأمين ضد الفيضانات (71515) مكاتب 
هؤلاء الموظفين؛ إذ تم سَكْبُ حزم كثيرة من التقارير المخططة باللون الأخضر من 
الطابعة ا مركزية في تلك المكاتب. كانت التقارير الفردية في بعض الأحيان ذات سُمْك 
يبلغ ios) V‏ مع مجموعة صلبة من المعلومات حول مطالبات التأمين أو أقساط 
التأمين. أو مدفوعات مدفونة فيها في مكانٍ ما. 

لايدّعي بيل بارتون ومايك مايلز أنهما قادران على فعل أي شيء حيال الطقس؛ 
ولكن bles Ea ihl Soa el‏ الحاسب: على التواليء من مؤسسة علوم الحاسب (©5©) 
باستخدام برنامج 111608060175 من ”بناة المعلومات“ لإعادة تدفق فيضان الورق 
بواسطة .N۴1۴‏ يسمح البرنامج للحكومة بالعمل مع شركات التأمين الوطنية؛ لجمع 
أقساط التأمين ضد الفيضانات ودفع المطالبات للفيضانات في المجتمعات التي تبني 
تدابير معينة للتحكم في الفيضانات. وكنتيجة لعمل لجنة ‘CSC‏ $ يَعْد موظفو 7111/4 
بحاجة إلى تصفح تقارير ورقية للعثور على البيانات التي يحتاجون إليها. وبدلًا من 
ذلك؛ يتصفحون بيانات التأمين 4:4 855 «NFIP's BureauNet 354 (4 e‏ ويختارون 
فقط ا معلومات التي يرغبون في رؤيتهاء ويحصلون منها على تقريرٍ معروض على شاشة 
أو يقومون بتنزيل البيانات في صورة جدول. وهذه مجرد بداية للمدخرات التي قدَّمها 
575 وقد انخفض عددٌ المرات التي يطلب فيها موظفو 11118 من ©56© 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wo‏ 


الفصل الثاني 


لتقارير خاصة إلى النصف؛ لأن موظفي NFIP‏ صار بإمكانهم إنشاءٌ العديد من التقارير 
الخاصة التي يحتاجون إليها دون استدعاء مبرمج لتطويرها. إضافةً إلى تكلفة إنشاء 
BureauNet‏ $ امقام الأول. ويْقَدٌر بارتون أن استخدام برمجيات الويب وقاعدة 
البيانات التقليدية لتصدير البيانات من الإطار المركزي ل 55:314. وتخزينها في قاعدة 
بيانات جديدة: وربطها بخادم ويب - قد يُكلّف قرابة ال ٠٠١‏ ضعف - أي أكثر من 
دولار - ويحتاج إلى حوالي عامين لإكماله» مقارنةً بالأشهر القليلة التي قضاها 
مايلز للوصول إلى -WebFOCUS (3:)b os JoJl‏ 

عندما هبّت عاصفة أليسون الاستوائية. وهي عبارة عن مجموعة سحابية 
ضخمة من الغيوم الدؤارةء وتحرّكت من خليج المكسيك على ساحل تكساس 
ولويزيانا في يونيو ۲۰۰۱ قتلت ۲٤‏ شخصًا معظمهم من الغرقء كما دمّرت 
وحطّمت 1٠٠٠١‏ منزل وشركة» كما شرّدت أكثر من ٠٠٠٠١‏ عائلة. وأعلن الرئيس 
جورج دبلیو بوش مقاطعة تکساس ۲۸ كمنطقة کوارٹ» وتحرّکت ۴٤۸‏ 
للمساعدة. كان هذا أول اختبار 2 BureauNet —J 3L‏ وتم تسليمه بالفعل. 
وقد أدّی هذا الاستخدام الشامل الأول ل 8٥۵0۸۲‏ إلى وصول موظفي 182/14 
ا ميدانيين بسهولة إلى ما يحتاجون إليه عند الحاجة إليه. وطلب العديد من أنواع 
التقارير الجديدة. ولحُمَن الحظء كان مايلز و175 116058060 على مستوى المهمة. 
يقول بارتون: «في بعض الحالات سوف تطلب la> Ég FEMA‏ من التقارير Úy‏ 
ماء وسيحصل عليه مايلز على 8116811716 في اليوم التالي؛ وذلك بفضل السرعة التي 
يمكنه بها إنشاء تقارير جديدة -«WebFOCUS (à‏ 

وأشار بارتون إلى أن الطلب المفاجئ على النظام لم يكن له تأثيرٌ كبيرٌ على أدائه. 
ويضيف: «لقد تعاملنا مع الطلب على ما يُرام؛ فلم تكن لدينا مشكلات في ذلك على 
الإطلاق. وقد أحدثنا فرقًا هائلًا ل 858314 وللوظيفة التي كان عليهم القيامٌُ بها. إذ م 
يكن لديهم هذا المستوى من الوصول من قبل؛ وأيضًا لم يكن بإمكانهم إنشاء مثل هذه 
التقارير المفضّلة والمحدّدة بمجرد النقر بالماوس على سطح مكتبهم كما هو الحال الآن». 

أسئلة للمناقشة: 

FEMA g l -\‏ وماذاتفعل؟ 


۲- ما هي التحديات الرئيسية التي تواجهها SFEMA‏ 


wi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائيةء تصوير البيانات 


۳- کیف قامت 81314 بتحسين ممارساتها غير الفعّالة لإعداد التقارير؟ 
Source: Information Builders success story. Useful information flows at‏ 
disaster response agency. informationbuilders.com/applications/fema‏ 


(accessed May 2016); and fema.gov. 

أسئلة مراجعة على القسم ۷-۲: 
-١‏ ما هو التقرير؟ وفيم تُستَخدّم التقارير؟ 
۲- ما هو تقرير الأعمال؟ وما هي الخصائص الرئيسة لتقرير الأعمال الجيد؟ 
-Y‏ قم بوصف العملية الدورية للإدارة. مع التعليق على دور تقارير الأعمال. 
-٤‏ اذكر مع الشرح الفئات الثلاث الرئيسة لتقارير الأعمال. 
-٥‏ ما هي المكوّنات الرئيسة لنظام إعداد تقارير الأعمال؟ 
۸-۲ تصوير البيانات: 

تمّ تعريف تصوير البيانات (أو بشكل أكثر ملاءمةً التصوير المعلوماق) على أنه «استخدام 
التمثيلات المرئية لاستكشافء ووضع منطقء ونقل البيانات» (2007 ,1657). وعلى الرغم من أن 
الاسم المُستخدّم بشكل شائع هو تمثيل البيانات؛ فإن المقصود من هذا هو تصوير المعلومات. 
ولأن المعلومات هي تجميع وتلخيص ووَضْع البيانات في سياقها (حقائق أولية)؛ فإن ما يتم 
تصويره هو المعلومات وليس البيانات. ومع ذلك؛ ونظرًا لاستخدام ال مصطلحين تصوير البيانات 
وتصوير ا معلومات بشكل متبادل ومرادف؛ فإننا سنتبع ذلك في هذا الفصل. 

يرتبط تصويرٌ البيانات ارتباطًا Slag LÄS‏ الرسومات البيانية للمعلومات» وتصوير 
ا معلومات والتصؤر العلمي والرسومات البيانية الإحصائية. وحتى وقت قريب؛ كانت الأشكال 
الرئيسة لتصوير البيانات المتاحة في كلّ من تطبيقات ذكاء الأعمال تتضمّن الجداول والرسوم 
البيانية؛ إضافةً إلى الأنواع الأخرى من العناصر المرئية المستخدّمة لإنشاء بطاقات الأداء ولوحات 
البيانات. ومن أجل فهم أفضل للاتجاهات الحالية والمستقبلية في مجال رؤية البيانات؛ فنرى هنا 
أنه من الأفضل البدء ببعض السياق التاريخي. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yvy‏ 


الفصل الثاني 
لمحة تاريخية عن تصوير البيانات: 

على الرغم من حقيقة أن تاريخ تصوير البيانات يعود إلى القرن الثاني الميلادي؛ فإنَّ معظم 
التطورات التي حدثت في المئتين وخمسين عامًا الماضية؛ حدثت في الغالب خلال الثلاثين سنة 
الأخيرة فقط (2007 :5861). وعلى الرغم من أن التصوير SU‏ لم يُعترف به على gels Gl‏ 
elus‏ حتى وقت قريب؛ فإنّ الأشكال المرئية الأكثر شيوعًا اليوم تعود إلى بضعة قرون سابقة. 
وقد شجّع الاستكشاف الجغرافيء والرياضيات» والتاريخ الشعبي على إنشاء خرائط مبكرةء ورسوم 
dol‏ وجداول زمنية تعود إلى القرن السابع عشر؛ غير أنَّ الفضل ينس ب إلى ويليام بلايفير على 
نطاق gels‏ كمخترع الرسم البياني الحديث؛ وذلك بعد أن أنشأ أول شريط رسومات بيانية مُوزَّع 
على نطاق واسع في أطلسه التجاري والسياسي لعام 17/87م: وهو ما يُعَد بشكلٍ عام أولّ سلسلة 
زمنية تصوّر الرسومات البيانية في كتابه الإحصايء الذي تُشْرَ في عام ۱۸۰۱م (انظر: الشكل 15-7). 


| الصادرات والواردات من وإلى الدانمارك والترويج من 1700 إلى 1780 





The Botim Lue i dirik isto. Mara, he Righe harut line ant» 10000 nach. 


شکل ۱۹-۲: خط بياني لأول سلسلة زمنية عن à WILLIAM PLAYFAIR (3; jb‏ ۱۸۰۱م 

ولعل أبرز مبتكر للرسومات البيانية للمعلومات خلال هذه الفترة؛ كان تشارلز جوزيف 
ميناردء الذي صوّر بيانيًا الخسائر التي تكبّدها جيش نابليون في الحملة الروسية عام ١١۸١م‏ 
(انظر: الشكل 70-7). بدايةً من الحدود البولندية - الروسية» يوضّح الخط السميك حجم الجيش 


WA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 














التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


في كلّ موقع. ويظهر مسار تراجع نابليون من موسكو في فصل الشتاء القارس من خلال الشريط 
السّغلي المظلم المرتبط بدرجات الحرارة والفترات الزمنية. يقول خبير التصوير البياني والمؤلف 
والناقد الشهير إدوارد توفت أنَّ هذا «قد يكون أفضل رسم بياني إحصائي يتم رسمه على الإطلاق». 
في هذا الرسم البياني؛ تمّ تمثيل slal 83s; 5I Minard‏ للبيانات (مثل: حجم الجيشء واتجاه 
الحركة» والمواقع الجغرافيةء ودرجة الحرارة الخارجيةء وما إلى ذلك) بطريقة فنية وإعلامية. وقد 
شهد القرن العشرون بزوغ سلوك جديد للتصوير البياني يتسمٌ بأنه أكثر رسميةً وتخطيطًاء والذي 
كان يميلٌ إلى التركيز على جوانب. مثل: اللون» ومقاييس القيمةء ووضع العلامات. وفي منتصف 
القرن العشرينء أصدر رسام الخرائط والباحث النظري جاك بيرتين كتابه «علم الرسم البياني»» 
والذي يقول عنه البعض: إنه يُعتبّر بمثابة الأساس النظري للتصوير الحديث للمعلومات. وعلى 
الرغم من أن معظم أنماطه قد تقادمت بسبب الأبحاث الحديثة أو عدم قابليتها للتطبيق بشكلٍ 
كامل على الوسائط الرقمية؛ فإنَّ الكثير منها ما زال مناسبًا للغاية. 

ومع بدايات الألفية الجديدة؛ ظهر الإنترنت كوسيط جديدٍ للتصوير البيانيء وجَلَبَ معه الكثير 
من الحيل والقدرات الجديدة. ولم يجعل التوزيع الرقمي كلا من البيانات والتصوير البياني على 
مستوى العام أكثر سهولةٌ للوصول إلى جمهور أوسع (أَيْ: زيادة محو الأمية المرئية)؛ بل حفّز 
أيضًا تصميم نماذج جديدة تتضمّن التفاعل والرسوم ال متحركةء وعرض الرسومات البيانية للتقنية 
الفريدة من نوعها لشاشات الوسائطء وتغذية البيانات بشكلٍ فوري لإنشاء بيئات غامرة للتواصل 
واستهلاك البيانات. 

وقد اهتمَّت الشركاثٌ والأفراد بالبيانات بشكلٍ مفاجئ» وهذا الاهتمام أثارٌ بدوره الحاجة إلى 
أدوات مرئية تساعدهم على فهمها. وتعمل أجهزة الاستشعار الرخيصة الثمن مع فلسفة «قم 
ببناء نظامك الخاص بنفسك» على تقليل تكاليف جمع البيانات ومعالجتها. وقد أذَّى ظهور 
عدد لا يُحصَّى من التطبيقات الأخرىء وأدوات البرامج» ومكتبات الشفرة منخفضة المستوى إلى 
مساعدة الناس في جمع البيانات وتنظيمها ومعالجتها وتصويره ا وفهمها عمليًا من أيّ مصدر. 
وقد كان الإنترنت أيضًَا بمثابة قناة توزيع رائعة للتصويرات البيانية؛ فقد تمّ تجميع مجموعة 
متنوعة من المُصمّمين والمبرمجين ورسامي الخرائط والمشتغلين بالصيانة» والبيانات المفككة لنشر 
كلّ أنواع الأفكار والأدوات الجديدة للعمل مع البيانات في كل من الأشكال المرثية وغير المرئية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ws‏ 


الفصل الثاني 











ع ع 


شكل :0-١‏ هلاك جيش نابليون في أثناء الحملة الروسية لعام ١١۸١م‏ 
كما dS) Lice Uil Google ll, cua‏ فردية في كل من اتفاقيات الواجهة (انقر للتنقلء 
انقر نقرًا مزدوجًا للتكبير) والتقنية (خريطة بحجم 01 بكسل مربع مع أسماء ملفات يمكن 
التنبؤ بها) لعرض الجغرافيا التفاعلية عبر الإنترنت؛ بالشكل الذي يعلم به معظم الناس ما يجب 
عليهم فعله عندما يتخ تقديم خريطة عبر الإنترنت. لقد قدَّم 8وه1:ة خدمةً Baz‏ كمنصة تصفّح 
لتصميم وتطوير تطبيقات إنترنت غنية وجميلة تتضمّن تصويرات وخرائط بيانات تفاعلية؛ وفي 
الوقت الحالي؛ بدأت تقنيات جديدة للمتصفحات في الظهور, مثل: 0883:85: و5156 (والتي يتم 
تضمينها مجتمعةً في بعض الأحيان تحت مظلة )11M15‏ لتحَدّي السيادة التي حظي بها فلاش 
والعمل على زيادة فرص وصول واجهات التصوير المتحرك إلى أجهزة التليفون المحمولة. 
يصعب التنبؤ بمستقبل تصوير البيانات/ المعلومات. يمكننا فقط أن نستنتج مما تمّ اختراعه 
بالفعل: المزيد من التصوير ثلائي الأبعاد. وتجربة مليئة بالبيانات المتعددة الأبعاد في بيئة الواقع 
الافتراضي, والتصوير البياني المُجسّم للمعلومات. وهناك فرصة جيدة بأن نرى شيئًا جديدًا لم 
نشهده من قبل في ble‏ تصوير المعلومات الذي تم اختراعه قبل نهاية هذا العقد. وتومّح الحالة 
العملية 7-7 كيف أن أدوات التحليلات/ التقارير المرئية مثل 10116811" يمكنها أن تساعد في 
تسهيل اتخاذ القرار بفعالية وكفاءة من خلال إنشاء ومشاركة المعلومات/ المعرفة. 


1۰ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائية. تصوير البيانات 


حالة عملية 5-9 

ماكفارلان سميث يحسن رؤية الأداء التشغيلي باستخدام عدنام0 ننهء1ة1]” 
معلومات أساسية: 

حصل مكفارلان سميث على مكانة في التاريخ الطبي؛ إذ عقدت الشركة تعييئًا ملكيًا 
لتوفير الدواء لجلالة الملكة فيكتوريا وزوّدت أخصاق التوليد الرائد السير جيمس سيمبسون 
بالكلوروفورم لتجاربه في تخفيف الألم في أثناء المخاض والولادة. وتَعَدٌ اليوم ماكفارلان 
سميث شركة Johnson à$ 4J à soUJI Catalystss Fine Chemical à SJ à sob‏ 
d sjs .Matthey plc‏ الشركة المصنّعة للآدوية؛ هي الشركة الرائدة في العالم في تصنيع 
المخدّر الأفيوني مثل: الكودايين وال مورفين. ويقوم موظفو مكفارلان سميث كلّ يوم باتخاذ 
قرارات بناءً على بياناتهم. فهم يقومون بجمع وتحليل البيانات التشغيلية للتصنيع» 
مثل بيانات تسمح لهم بتحقيق أهداف التحسين المستمر. وتعتمد كل من المبيعات 
والتسويق والتمويل على البيانات؛ لتحديد فرص الأعمال التجارية الدوائية الجديدة, 
وتنمية العائدات الاستثمارية وتلبية احتياجات العملاء. وإضافةً إلى ذلك؛ يحتاج فرع 
الشركة في إدنبره إلى مراقبة بيانات الجودة واتجاههاء وإعداد تقارير عنها؛ لضمان هويتها 
وجودتها ونقاء كل مكوناتها الدوائية للعملاء والس لطات التنظيميةء مثل إدارة الغذاء 
والدواء الأمريكية (824) وغيرها كجزء من ممارسات التصنيع الجيدة (61/17ت). 


التحديات: مصادر متعددة للحقيقة والبطء» وعمليات إعداد التقارير المرهقة: 


لم تكن عملية جمع تلك البيانات واتخاذ القرارات» وإعداد التقارير سهلةٌ على الرغم 
من ذلك. فقد كانت البيانات الخاصة بالنشاط التجاري مبعثرةً: مما في ذلك توصيات 
الشركة بشأن تخطيط موارد اممشروع (ERP)‏ داخل قواعد البيانات الإدارية القدهة مثل 
SQL‏ وقواعد بيانات ١١٠ء4‏ وجداول البيانات المستقلة. وعندما تم الاحتياجً لهذه 
البيانات لصّنع القرارء تمّ تكريس وقت طويل جدًا وتخصيص موارد مفرطة للتنقيب في 
البيانات ودمجها وعرضها في جدول بيانات أو في أيّ وسيلة عرض أخرى. 

وكانت جودة البيانات مصدر قلق آخر. ونظرًا لاعتماد فرق العمل على مصادرهم 
الفردية للبيانات؛ فقد كانت هناك إصدارات مُتعدّدة من الحقيقة والتعارضات بين 
البيانات. وكان من الصعب أحيانًا معرفة أيّ إصدار من البيانات كان صحيحًا وأيها لم 
يكن كذلك. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Y‏ 


الفصل الثاني 


لم يتوقف الأمرٌ عند هذا الحد؛ فحتى بعد جمع البيانات وعرضهاء كان إجراء 
تغييرات «على الطاير» بطيئًا وصعبًا. وفي الواقع؛ كلما حاول أحد أعضاء فريق ماكفارلان 
سميث عمل اتجاه للبيانات أو إجراء أيّ تحليل آخر؛ فإن التغييرات التي تطرأ على 
البيانات كانت تحتاج إلى الموافقة عليها. وكانت النتيجة النهائية هي أن البيانات كانت 
متقادمة بشكلٍ مؤثر جدًا في الوقت الذي كانت تستخدم في aio‏ القرار. 

ويُسلّط ليام ميلزء رئيس قسم التحسين المستمر في ماكفارلان سميث» الضوءَ على 
سيناريو نموذجي لإعداد التقارير؛ فيقول: «تتمثل إحدى عملياتنا الرئتيسية في إعداد 
التقارير في الإجراء التصحيحي والإجراء الوقائي sas .CAPA sl‏ عبارة عن تحليلٍ 
لعمليات التصنيع في ماكفارلان سميث التي تمّ اتخاذها لإزالة أسباب عدم التوافق 
أو حالات أخرى غير مرغوب فيها. كما تمّ تخصيصٌ مئات الساعات كل شهر لسحب 
البيانات آنيًا من أجل 0424 - واستغرق الأمر أيامًا لإنتتاج كل تقرير. وكان تحليلٌ 
الاتجاهات صعبًّا أيضَا؛ٍ لآن البيانات كانت ثابتة (ساكنة). وفي سيناريوهات أخرى 
لإعداد التقاريرء غالبًا ما كان يتحتم علينا انتظارٌ تحليل جدول محوري لجدول البيانات؟ 
والذي تم تقديمه بعد ذلك في axe Lo Cua GS «do ee B)‏ وتثبيته على الحائط؛ 
كي يراجعه الجميع بسهولة». 

كانت عمليات إعداد التقارير البطيئة وامكثفة للعمالة» والنسخ امختلفة للحقيقة 
والبيانات الساكنةء كانت كلها عوامل محفزة للتغيير. يقول ميلز: «شعر الكثيرون 
بالإحباط؛ لأنهم اعتقدوا أنهم ليس لديهم صورة كاملة عن العمل. لقد أجرينا الكثير 
والكثير من المناقشات حول القضايا التي واجهناها - عندما كان علينا التحدّّث عن 
تقارير ذكاء الأعمال». 
الحل: تصويرات البيانات التفاعلية: 

كان لدى أحد أعضاء فريق ماكفارلان سميث خبرة سابقة في استخدام نلهءااة1 
وأيضًا استكشاف الحلول المُوصَى بها من قبل ميلز. وسرعان ما أقنعت نسخة تجريبية 
de b 5L« Tableau Online ja à ts‏ إضافة التصوير التفاعلي للبيانات يمكنه 
التغلّب على مشكلات البيانات التي كانوا يواجهونها. 


ويضيف: «لقد فزت في الحال تقريبًا. فإن سهولة الاستخدام والأداء الوظيفي 
واتساع تصويرات البيانات كلها مثيرة جدًا للإعجاب. وبالطبع؛ كونها حلاً قائماً على 


MY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


البرمجيات كخدمة (5385)؛ فإنه لا يُوجَد أي استثمار في البنية التحتية التقنية يمكننا أن 
نعيشه على الفور تقريبًاه وأيضًا لدينا المرونة لإضافة المستخدمين كلما احتجنا إلى ذلك». 

إن أحد الأسئلة الرئيسية التي يجب الإجابة عنها تتعلق بأمان البيانات عبر الإنترنت. 
«لدى الشركة الأم جونس ون مائي إستراتيجية السحابة؛ ولكن يجب أن نكون متأكدين من 
أن إضافة أيّ حل آمن Jas JI Jana Jis Tableau Online cas ò! -Gle‏ $2531( 
والسّماح للمستخدمين المصرّح لهم فقط بالتعامل مع البيانات توفر الأمان والثقة اللازمين». 

GT‏ سؤال الأمان الآخر الذي كان ماكفارلان سميث وجونسون مافي يريدان الإجابة عنه: 
e oJ‏ تخزين البيانات ماديًا؟ يضيف ميلز: «نحن ‘Tableau Online shÎ ġe ġgòlj‏ 
والذي يستوف المعايير الخاصة بنا لأمان البيانات والخصوصية؛ إذ تتم استضافة البيانات 
والمصنّفات في مركز بيانات دبلن الجديد في Tableau‏ لذلك فهي لا تغادر أوروبا أبدّا». 

وبعد تجربة دامت ستة goli‏ عمل خلالها مدير المبيعات في as ga Tableau‏ 
وفريقه لبناء قضية تجارية Tableau Online J‏ وافق فريق الإدارة على ذلك على الفورء 
وبدأ برنامج تجريبي يضم ٠١‏ مستخدمين. وشملت التجربة مبادرة لتحسين جودة التصنيع: 
بالنظر إلى الانحرافات عن القاعدة. كأن يتجاوز جهاز التسخين المستخدّم في عملية تصنيع 
المخدرات الأفيونية درجة الحرارة. من هذا ا منطلق؛ تمّ إنشاء لوحة معلومات «عمليات 
الجودة» لتتبّع وقياس الانحرافات ووضع إجراءات لتحسين الجودة والأداء التشغيلي. 

يقول ميلز: «أشارت لوحة المعلومات هذه على الفور إلى أماكن الانحرافات. لم نكن 
ننشط عبر صفوفٍ من البيانات - لقد توصّلنا إلى إجابات فورية». 

وخلال هذه التجربة الأوّلية والتجريبية؛ استخدم الفريق أدوات التدريب ننهءاطه1 
مثل مقاطع الفيديو التدريبية ا مجانيةء وإرشادات الممنتجات والتدريب الممباشر عبر 
الإنترنت. كما شاركوا في حدث «التدريب الأساسي» على مدى يومين في لندن. ووفقاً 
Ld‏ 5: «كان التدريب دقيقًا وموجهًا فقط على المستوى الصحيح. وقد أظهر للجميع 
äs Tableau Online Ugg—u Gao hä‏ أصبح بإمكاننا تصوير ٠١‏ سنوات من 
البيانات في عدد قليل من النقرات». لدى الشركة الآن خمسة مستخدمين لسطح مكتب 
11 : وما يصل إلى ٠٠١‏ مستخدم مرخص ل .Tableau Onli1¢‏ 

وبشكلٍ خاصٌ يشبه میلز وفریقه ملامح ۸٥0ا 1٥1۵‏ فی الإصدار ٩,۳‏ مما يتيح لهم 
ضمٌ البيانات التي تمّ تقسيمها إلى ملفات صغيرة. ويضيف: «من الصعب أحيانًا تجميع 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري MY‏ 


الفصل الثاني 


البيانات التي نستخدمها للتحليل؛ إذ تتيحٌ لنا مَيْرة الاتحاد العمل مع البيانات اممنتشرة عبر 
das‏ علامات تبويب أو ملفات؛ مما يقلل من الوقت الذي نقضيه في إعداد البيانات. 
النتائج: تحليلات السّحابة تقوم بتحويل صُنع القرار وإعداد التقارير: 
من خلال توحيد ال معايير على 021126 18116811, حول ماكفارلان سميث سرعة 
ودقة اتخاذ القرار وإعداد تقارير الأعمال. وهذا يتضمّن: 
- يمكن إنتاجٌ لؤحات تفاعلية جديدة خلال ساعة واحدة. في السابق؛ كان يستغرق الأمرٌ 
أيامًا لدمج البيانات وعرضها في جدول بيانات ثابت. 
- هكن الآن إنتاج تقرير عملية تصنيع CAPA‏ ف دقائق» والذي كان يستغرق إنتاجه في 
السابق المئات من ساعات العمل كل شهر - مع الأفكار المشتركة في السحابة. 
يمكن تغيير التقارير والاستعلام «على الطاير» بسرعة وسهولةء دون تدخل تقني؛ إذ يتمتع 
ماكفارلان سميث با مرونة لنشر لوحات المعلومات مع ٠11۵ء‏ ومشاركتها مع الزملاء 
أو الشركاء أو العملاء. 


تمتلك الشركة نسخةً واحدةً وموثوقةً من الحقيقة. 


- تجري ماكفارلان سميث حاليًا مناقشات حول بياناتها - وليس حول القضايا ا متعلقة 
بتكامل وجودة البيانات. 

يمكن جلب المستخدمين الجدد عبر الإنترنت على الفور تقريبًا - وليس هناك بنية أساسية 
تقنية لإدارتها. 

وبعد هذا النجاح المبدي؛ يقوم ماكفارلان سميث الآن بتوسيع نطاق 

0116 ننهءااة1 إلى إعداد التقارير المالية: وتحليلات سلاسل التوريد وتوقعات 
المبيعات. ويختتم ميلز قائلًا: «تستند إستراتيجية أعمالنا الآن على قرارات تعتمد 
على البيانات وليس على الآراء. كما تمُكّننا التصويرات التفاعلية من تحديد الاتجاهات 
بشكلٍ فوريء وتحديد التحسينات في العملية واستخلاص ذكاء الأعمال إلى المستوى 
التالي. أستطيع الآن تعريف مهنتي بواسطة ننهءاطه1». 


أسئلة للمناقشة: 


-١‏ ما هي التحديات المتعلقة بالبيانات وإعداد التقارير التي واجهت ماكفارلان 


3Macfarlan Smith سميث‎ 


YE‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


Lo -Y‏ هو الحل وماذا كانت النتاتج/ الفوائد التي S‏ الحصول عليها؟ 
Source: Tableau Customer Case Study, “Macfarlan Smith improves operational‏ 
performance insight with Tableau Online,” http://www.tableau.com/stories/customer/‏ 
macfarlan-smith-improves-operational-performance-insight-tableau-online (accessed‏ 


October 2016). 


أسئلة مراجعة على القسم ۸-۲: 

-١‏ ما هو تصوير البيانات؟ وماذا يتم الاحتياج إليه؟ 

؟- ما هي الجذورٌ التاريخية لتصوير البيانات؟ 

di> -Y‏ بعناية تصوير تشارلز جوزيف مينارد الرسمى لمسيرة نابليون. مع تحديد والتعليق على 
جميع أبعاد المعلومات التي تمَّ التقاطها في هذا الرسم البياني القديم. 

$A -E‏ هو إدوارد توفت؟ وبرأيك اذا علينا أن نتعرف على ما قام به من عمل؟ 

ه- ما هو في رأيك «الشيء الكبير التالي» في تصوير البيانات؟ 


٩-۲‏ الأنواع المختلفة للمخططات والرسوم البيانية: 

غالباً مايكون المستخدمون النهائيون لأنظمة تحليلات الأعمال غير متأكدين من نوع الرسم 
البياني أو الجدول البياني الذي يجب أن يستخدموه لغرض معين؛ إذ تكون بعض الرسوم أو 
الجداول البيانية هي أفضل في الإجابة عن أنواع معينة من الأسئلة؛ فقد يبدو بعضها أفضل 
من غيرها ويبدو البعض الآخر بسيطًء ويكون البعض الآخر معقدًا ومزدحمًا إلى حَذٌّ ما. وفيما 
iog‏ موجرٌ لأنواع الرسوم البيانية و/ أو الجداول البيانية الشائعة في معظم أدوات تحليل 
الأعمال وأنواع الأسئلة التي هي أفضل في الإجابة/ التحليل. وقد تمَّ تجميعٌ هذه المواد من العديد 
من المقالات المنشورة وغبرها من ال منشورات (آأبیلا ۲۰۰۸؛ هاردن ۲۰۱۲؛ ساس ٤٠۲۰؛‏ وآخرون). 


المخططات والرسوم البيانية الأساسية: 
فيما يلي المخططات والرسومات البيانية الأماسية التي تُستخدّم عادةً لتصوير المعلومات. 
yal ga (Line Chart) GUI es Jl Jas‏ البيانية الأكثر استخدامًا لبيانات السلاسل 


الزمنية. وتوضّح المخططات الخطية (أو الرسوم البيانية الخطية) العلاقة بين متغيرين؛ وغاليًا ما يتم 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Mo‏ 


الفصل الثاني 


استخدامها لتتبّع التغييرات أو الاتجاهات عبر الوقت (تعيين أحد المتغيرات إلى الوقت على المحور 
السيني). وتعمل امخططات الخطية على توصيل نقاط بيانات فردية بشكلٍ متعاقب للمساعدة 
في استكشاف الاتجاهات المتغيرة على مدار فترة زمنية. وغالبًا ما يتم استخدام ا مخططات الخطية؛ 
لإظهار التغييرات المعتمدة على الوقت في قيّم بعض المقاييس» مثل: التغييرات على سعر سهم معين 
على مدار 0 سنوات أو تغييرات على عدذ المكالمات اليومية لخدمة العملاء على مدار الشهر. 
شريط الرسم البياني 0250© 8): تُعَذُ من أكثر العناصر الأساسية الأكثر استخدامًا لتمثيل 
البيانات. تكون الرسوم البيانية الشريطية فعّالة عندما يكون لديك بيانات اسمية أو بيانات رقمية 
تنقسم بشكل جيدٍ إلى فئات مختلفة؛ بحيث يمكنك مشاهدة النتائج والاتجاهات النسبية في بياناتك 
بسرعة. وغالبًا ما يتم استخدام المخططات الشريطية بلقارنة البيانات عبر فئات متعددة مثل النسبة 
المئوية للإنفاق الإعلاني بحسب الأقسام أو بحسب فئات المنتجات. يمكن أن تكون المخططات الشريطية 
عموديةً أو أفقية. ويمكن أيضًا تحزيمها بعضها فوق بعض؛ لإظهار أبعاد متعددة في مخطط واحد. 
الرسم البياني الدائري (03 6ذ©): وكما يوحي اسمها؛ فهي تكون جذَابة للعين. مخطط 
دائري الهيئة. ولأنها جذابة dà‏ فغالبًا ما نُستَخدّم بشكل غير صحيح. فعلى سبيل المثال: يمكن 
استخدامها لعرض النسبة المئوية النسبية لميزانية الإعلان التي يتم إنفاقها على خطوط الإنتاج 
المختلفة» أو يمكن أن تظهر النّسَب النسبية من التخصصات التي التحق بها طلاب الجامعات في 
سنتهم الدراسية الثانية. فإذا كان عدد الفئات المراد إظهارها كبيراً إلى حَذَّ ما (على سبيل المثال: أكثر 
من أربعة)؛ فيجب التفكير بجدية في استخدام شريط الرسم البياني بدلا من الرسم البياني الدائري. 
ls Jl (Scatter Plot) jel gye‏ يتم استخدامها لاستكشاف العلاقة بين متغيرين أو 
ثلاثة (في الصور ثنائية الأبعاد). ولأنها أدوات استكشاف بصرية» ولديها أكثر من ثلاثة متغيرات؛ 
فإن ترجمتها إلى أكثر من ثلاثة أبعاد لا يمكن تحقيقها بسهولة. وهي dl, us‏ فعَالةٌ لاستكشاف 
وجود الاتجاهات والتركيزات والقيم المتطرفة. فعلى سبيل المثال: في الرسم البياني ذي المتغيرين 
(المحورين)» يمكن استخدام مربع التبعثر لتوضيح علاقة الارتباط بين AE‏ ووَزْن مرضى القلب» آو 
يمكن أن يوضّح العلاقة بين عدد ممثلي خدمة العملاء وعدد مطالبات خدمة العملاء المفتوحة. 
ds‏ كثير من الأحيان؛ يتم فرص خط اتجاه على مربع التبعثر US‏ الأبعاد لتوضيح طبيعة العلاقة. 
الرسم البياني الفقاعي «(Bubble Chart)‏ هي غالبًا ما تكون عبارة عن نسخة مُحسّنةَ من 
مربع التبعثر. وعلى الرغم من ذلك؛ فهي لا تُعَدُ نمطًا مرئيًا جديدًا؛ بل ينبغي النظر إليها على 
أنها تقنيةٌ لإثراء البيانات المومّحة في مخططات التبعثر (أو حتى الخرائط الجغرافية). ومن 





MW‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


خلال تفاوت حجم و/ أو لون الدوائر؛ هكن إضافةٌ أبعاد إضافية للبيانات؛ مما يعطي معنّى أكثر 
ch‏ حول البيانات. فعلى سبيل المثال: يمكن استخدامٌ رسم بياني فقاعي؛ لإظهار عرض تنافسي 
لحضور الفصل الدراسي على مستوى الكلية حسب التخصص» وحسب الوقت من اليوم» أو مكن 
استخدامه لعرض هامش الربح حسب نوع ال منتج وحسب المنطقة الجغرافية. 


المخططات والرسوم البيانية المتخصصة: 

إن الرسوم والمخططات البيانية التي نراجعها في هذا القسم؛ إما مستمدة من المخططات 
الأساسية كحالات خاصة: أو iole yag Guus Swar lil‏ بنوع المشكلة أو منطقة التطبيق. 

(Histogram) glS gyal‏ من الناحية البيانية. يبدو المدرج التكراري وكأنه شريط 
رسم بياني (bar chart)‏ ويكمّن الفرق بينهما فقط في المعلومات التي يتم تصويرها. ويتم 
استخدامٌ المدرج التكراري 5 لإظهار التوزيع التكراري بلتغيرٍ أو لعدة متغيرات. في المدرج التكراري» 
غالبًا ما يُستَخدّم المحور السيني لإظهار الفئات أو النطاقات؛ في حين يتم استخدامٌ المحور الصادي 
لإظهار المقاييس/ القيم/ التكرارات. يُظهر المدرج التكراري 5 الشكل التوزيعي للبيانات. وبهذه 
الطريقة؛ من الممكن إجراء فحص بصري لتوزيع البيانات لمعرفة ما إذا كانت موزعةً توزيعًا 
طبيعيًا أو أسيًا. فعلى سبيل المثال: يمكن استخدامٌ المدرج التكراري لتوضيح أداء اختبار الفئة؛ إذ 
هكن عرض توزيع الدرجات إضافة إلى التحليل ا مقارن للنتائج الفرديةء أو يمكن استخدام المدرج 
التكراري لعرض توزيع أعمار قاعدة العملاء. 

الرسم البياني جانت (62240): هي حالة خاصة من شرايط الرسومات البيانية الأفقية التي 
تُستخدّم لتصوير الجداول الزمنية للمشروع ومدة مهام/ نشاط المشروع: والتداخل بين المهام/ 
الأنشطة. ومن خلال عرض تواريخ/ أوقات البدء والانتهاء للمهام/ للأنشطة والعلاقات المتداخلة؛ 
تُقدّم رسومات جانت مساعدات JAS Y‏ بثمن لإدارة المشاريع والتحكّم فيها. فعلى سبيل المثال: 
غالبًا ما يتح استخدامٌُ مخططات جانت لعرض المخططات الزمنية للمشروع وتداخلات المهامٌ 
وإكمال المهامٌ النسبية (شريط جزئي يُوضّح نسبة الإكمال داخل شريط يعرض المدة الفعلية 
(ingal‏ والموارد المخصصة لكل مهمة وا معام والإنجازات. 

(Pert) ce ll ea JI‏ (وتُسمَّى أيضًا الرسوم البيانية للشبكة)» ويتم تطويرها في المقام 
الأول؛ لتبسيط التخطيطء وجدولة المشاريع الكبيرة والمعقدة. وهي تُظهر علاقات الأسبقية بين 
أنشطة/ مهام المشروع. يتكوّن الرسم بيرت من عَقَد (ممثلة بدوائر أو مستطيلات) وحواق 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري AV‏ 


الفصل الثاني 


(ممثلة بالأمهم الموجهة). وبناءً على ما هو متعارف عليه بالنسبة لبيرت؛ فإنه يمكن استخدامٌ 
العقد أو الحوافٌ لتمثيل أنشطة/ مهام المشروع (مخطط النشاط على أساس العقد مقابل النشاط 
على أساس التمثيل السهمي). 

الخريطة الجغرافية (م28 (Geographic‏ عندما تتضمَّن مجموعة البيانات أيّ نوع من 
بيانات الموقع (مثل: العناوين المادية» أو الرموز البريدية» أو أسماء الولايات. أو الاختصارات» أو 
أسماء الدول» أو خطوط العرض/ الطولء أو بعض أنواع الترميز الجغرافي المخصص). ويكون من 
الأفضل والأكثر فائدةً الاطلاع على البيانات على خريطة. وعادةً ما يتم استخدام الخرائط بالتزامن 
مع الرسوم والمخططات البيانية الأخرى: بعضها في مقابل بعض. فعلى سبيل المثال: يمكن استخدامٌ 
الخرائط لعرض توزيع طلبات خدمة العملاء على حسب نوع المنتج (الموضّح في الرسوم البيانية 
الدائرية) على حسب المواقع الجغرافية. وفي كثير من الأحيان؛ يمكن تصويرٌ مجموعة كبيرة من 
المعلومات (مثل: التوزيع العمريء أو توزيع الدخلء أو التعليم أو النمو الاقتصاديء أو التغيرات 
السكانية) في خريطة جغرافية واحدة؛ للمساعدة في اتخاذ قرار بمكان فتح مطعم جديدء أو إنشاء 
محطة خدمة جديدة. وغالبًا ما تُسمَّى هذه الأنواع من النظم بنظم المعلومات الجغرافية (15©). 

مُخططات بولت gz k lë (Bullet)‏ استخدام مخططات ٥ا81‏ لإظهار التقدُم نحو 
الهدف. وهي في الأساس شكلٌ من أشكال شريط الرسم البياني. وغالبًا ما يتم استخدامها بدلا من 
المقاييس» والعدادات» ومقاييس الحرارة في لوحة المعلومات لتوصيل المعنى المراد توصيله بشكل 
أكثر بديهية ضمن مساحة أضغر بكثير. تقازن مخططات 811186 مقياصًا أساسيًا (مثل: الإيزادات 
السنوية) مع واحد أو أكثر من المقاييس الأخرى (مثل: هدف الإيرادات السنوي)» وتقدم ذلك في 
سياق مقاييس أداء معينة (مثل: حصص المبيعات). ويمكن لمخططات 18111166 أن توضُح بشكلٍ 
بديهي كيفية أداء الإجراء الأساسي مقابل الأهداف العامة (مثل: مدى قرب مندوب المبيعات من 
تحقيق حصته السنوية). 

الخريطة الحرارية (م319 11626): تُعَذَ الخرائط الحرارية عناصر مرئية رائعة؛ لتوضيح المقارنة 
بين القيم المستمرة عبر فئتين باستخدام اللون. ويكون الهدف منها هو مساعدة المستخدم على 
المشاهدة السريعة للمكان الذي يكون فيه تقاطع الفئات أقوى وأضعف من حيث القيم العددية 
للمقياس الجاري تحليله. فعلى سبيل المثال: من الممكن استخدامٌ خرائط الحرارة؛ لإظهار تحليل 
تقسيم الأمواق المُستَهدفة؛ بحيث يكون المقياس هو مبلغ الشراء (والذي يتم تمثيله بالتدرج 
اللوني)» وتكون الأبعاد هي العمر وتوزيع الدخل. 


yM‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


(Highlight Table) Jail Jalas‏ وتهدف جداول التظليل إلى اتخاذ خرائط الحرارة 
خطوة أخرى إلى الأمام. فإضافةً إلى إظهار كيفية تداخل البيانات باستخدام اللون؛ تضيف جداول 
K Highlight‏ $ الأعلى لتقديم تفاصيل إضافية. أي إنها جداول ثنائية الأبعاد ذات خلايا 
مملوءة بقيم رقمية وتدرجات لونية. فعلى سبيل المثال: من الممكن عرض أداء مندوبي المبيعات 
على حسب نوع المنتج وحجم المبيعات. 

الخرائط الشجرية OLLI od oag (Tree Map)‏ الهرمية (المهيكلة بشكلٍ شجري) 
كمجموعة من المستطيلات المتداخلة. إذ يتم إعطاء كلّ فرع من الشجرة مستطيلا. والذي يتم 
بعد ذلك تقاربه مع مستطيلات أصغر تمثل الفروع. ويحتوي مستطيل عقدة الورقة على مساحة 
تتناسب مع بُعد مُحدَّد في البيانات. وغالبًا ما يتم تلوين عُقد الأوراق؛ لإظهار بُعد منفصل للبيانات. 
وعندما ترتبط أبعاد اللون والحجم بشكلٍ أو بآخر مع هيكل الشجرة؛ فيمكن بسهولة رؤية الأماط 
التي يصعب اكتشافها بطرق أخرىء كأن يحظى لون معين بأهمية خاصة. أما الميزة الثانية لخرائط 
الأشجار؛ فهي أنها تستخدم الفضاء بكفاءة؛ وذلك عن طريق الشكل الهندسي الذي تتمتع به. 
ونتيجةً لذلك؛ فيمكنها عرض آلاف العناصر بشكلٍ مقروء وواضح على الشاشة في وقتِ واحد. 


g‏ مخطط أو رسم بياني يجب أن تستخدمه؟ 

ما هو الأفضلء فيما شرحناه سابقاً المخطط أم الرسم البياني؟ الإجابة سهلة إلى W h i‏ 
labis az)‏ أو رسمٌ بياني واحد هو الأفضل على الإطلاق؛ فلو كان الأمرٌ كذلك لما كان لدينا هذا 
الكم الكثيرُ من أنواع الرسومات والمخططات البيانية. فلدى JS‏ واحد منها «مهارات» مختلفة 
بعض الشيء في تمثيل البيانات عن الآخر. لذلك؟ ينبغي أن يكون السؤال الصحيح هو: «أيّ 
مخطط أو رسم بياني هو الأفضل لمهمة معينة؟» ويمكن أن تساعد إمكانات المخططات الموضّحة 
في القسم السابق في اختيار واستخدام الرسم / المخطط البياني ا مناسب لكل مهمة؛ ولكن يظل 
من الصعب فرزها. كما هكن استخدامٌ عدة أنواع مختلفة من الرسوم/ المخططات البيانية لنفس 
مهمة التمثيل التصويري. وتُعَدٌ إحدى القواعد الأساسية هي اختيار واستخدام أبسط البدائل 
لتسهيل فهم الجمهور المقصود واستيعابه. 

على الرغم من عدم وجود خوارزمية مقبولة وشاملة على نطاق geb‏ لاختيار وتصنيف المخطط / 
الرسم البيانيء يُقدّم الشكل 7١-١‏ تنظيمًا شاملًا ومنطقيًا إلى حدّ se‏ لأنواع المخططات/ الرسوم 
البيانية في بنية شبه تصنيفية (نُشرت النسخة الأصلية منه في أبيلا ۲۰۰۸). ويجب أن يتم تنظيم 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ma‏ 


الفصل الثاني 


البنية التصنيفية بالشكل الذي يجيب عن السؤال التالي: «ما الذي ترغبٌُ في إظهاره في الرسم/ 
المخطط البياني؟» بمعنى؛ ماذا سيكون الغرض من الرسم/ المخطط البياني. وعلى هذا ا لمستوى؛ يقوم 
التصنيف بتقسيم الغرض إلى أربعة أنواع مختلفة - العلاقة والمقارنة والتوزيع والبنية - Z5 GS‏ 
الفروع إلى فئات فرعية بناءً على عدد المتغيرات المتضمنة والاعتماد على الوقت في التصوير المرقي. 


EIEN LAL 


غلات كثيرة .فلات قردية أكيلة. نات غير دورية. Museu.‏ 
تي 





متغيرين لكل يقد 
“ias uoa‏ | 


A dx, ai 











ماذا تحب أن تعرض فى المخطط 
أو الرسم البياقى الخاص بك ؟ 

















تغيير مع مور الرفت 
REC t‏ 














source: Adapted from Abeia. A. (2008) Advanced Presentaion by desighn: Creating 


Communication that drives action. Newyork: wiley 
تصنيف الرسوم والمخططات البيانية‎ :۲٠-۲ شکل‎ 

على الرغم من أن هذه الرسوم والمخططات البيانية تغطي جزءًا كبيرًا مما هو شائع الاستخدام 

في تصوير المعلومات؛ فإنها لا تغطي كلّ ما يتعلق بهذا الموضوع. وفي الوقت الحاضر يمكننا إيجادٌُ 
العديدٍ من الرسوم والمخططات البيانية المتخصّصة الأخرى التي تخدم غرضاً معيناً. غلاوةٌ على 
ذلك؛ يتمثل الاتجاه الحالي في دمج/ تهجين وتحريك هذه الرسوم البيانية؛ للحصول على رؤية 
أفضل وأكثر بديهية لمصادر البيانات المعقدة والمتقلّبة اليوم. فعلى سبيل المثال: توفر الرسوم 
البيانية من نوع 811616 والرسوم التفاعلية: والرسوم المتحركة والمتاحة على موقع Gapminder)‏ 
تصودع) وسيلةً مثيرةً للاهتمام لاستكشاف بيانات الصحة والثروة والسكان من منظور 
مُتعدّد الأبعاد. ويوضّح الشكل 77-١‏ أنواع الشاشات المتوفرة في الموقع. ويوضّح هذا الرسم البياني 


Me‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائيةء تصوير البيانات 
كلا من حجم السكانء ومتوسط العمر المتوقع» ونصيب الفرد من الدخل على مستوى القارة؛ كما 
يتم عرض رسوم متحركة متغيرة بمرور الوقت ais EAS ger‏ هذه المتغيرات بمرور الوقت. 
Cmn a gg = |‏ 





19 
ل‎ 
7 
m 
م‎ x 
3 0 
a e 
eo: 
. 
am 
EET 
» 
» 
as 
8 -- STEERER ERT EEE SS 
س‎ 4 Two zow ako wwo mw مه‎ 
income per person (GOPrcapita. PPPS innaton-adjustod) -lg = 


Play e 5 د‎ Um كص‎ WAS HANE OMNE Tome, 
شكل 7-7؟: مخطط رسم جغرافي يُظهر ثروات وصحة الأمم‎ 


أسئلة مراجعة على القسم ۹-۲: 

-١‏ من وجهة نظرككء لماذا يُوجَد هناك العديدٌ من الأنواع المختلفة من الرسوم والمخططات البيانية؟ 

-Y‏ ما هي الاختلافات الرئيسية بين الرسوم الخطية والشريطية والدائرية؟ ومتى يجب عليك 
استخدامٌ أحدهم دون الآخر؟ 

"- لماذا تستخدم الخريطة الجغرافية؟ وما هي أنواع الرسوم البيانية الأخرى التي يمكن دمجها 
مع خريطة جغرافية؟ 

ع- أوجد واشرح دور نوعين من الرسوم البيانية التي لم يتم تغطيتها في هذا القسم. 

٠١-۲‏ نشأة التحليلات المرئية: 
كما لاحظ سيث غراهز (2009 طره)» هناك «ذوق متزايد» من تقنيات وأدوات تصوير البيانات 


التي تمكّن مُستخدمي تحليلات الأعمال وأنظمة ذكاء الأعمال من تحسين «علاقات الاتصال» وإضافة 
سياق تاريخي» وكشف الارتباطات الخفيةء وسرد قصص مقنعة توضّح العمل وتدعو لاتخاذ إجراء». 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري M‏ 








الفصل الثاني 


كما تؤكد أحدث إصدارات Magic Quadrant‏ على منصات ذكاء الأعمال ومنصات التحليلات 
الصادرة عن 65618 في فبراير 17١٠م‏ على أهمية تمثيل البيانات في ذكاء الأعمال والتحليلات. 
وكما يوضُح الرسم البياني؛ فإن جميع مقترحي الحلول وأصحاب الرؤى في الشركات القيادية هم 
إما شركات تصوير معلومات حديثة (QlikTech 5| Tableau Oleza i2) Eus voca‏ 
أو شركات تحليلات كبيرة وراسخة (مثل مايكروسوفت (1/1100501). و545: JBMs‏ و5842: و 
«Alteryx‏ وMicroStrategy)‏ والتي ترز جهودها بشكلٍ متزايد على تصوير المعلومات والتحليلات 
المرئية. وتعرض الرؤية الفنية ۲-۲ تفصيلاً لأحدث -Gartner J Magic Quadrant (ys jue ls‏ 

في ذكاء الأعمال والتحليلات» تمحورت التحَدّيات الأساسية لتصوير البيانات حول التمثيل 
البديهي لمجموعات البيانات الكبيرة والمعقدة ذات الأبعاد والمقاييس المتعددة. وبالنسبة للجزء 
الأكبر. عادةً ما تتضمّن المخططات والرسوم البيانية النموذجية والعناصر المرئية الأخرى اللُسِتَخدّمة 
في هذه التطبيقات بُعدَينء وأحيانًا ثلاثة أبعادد ومجموعات فرعية صغيرة جدّا من مجموعات 
البيانات. في المقابل؛ فإن البيانات الموجودة في هذه الأنظمة موجودة في مستودع البيانات. وكحد 
أدنى؛ تتضمّن هذه المستودعات نطاقاً من الأبعاد (مثل: المنتج؛ ا موقع» الهيكل التنظيميء الوقت)» 
ومجموعة من المقاييسء وملايين من خلايا البيانات. وفي محاولة للتصَدَّي لهذه التحَدّيات» طوّر 
Sas‏ من الباحثين مجموعةً متنوعةً من تقنيات التصوير الجديدة. 

رؤية فنية ۲-۲ 
جارتنر ماجيك كوادرانت لمنصّات ذكاء الأعمال والتحليلات 

يد جارتنر-إنك المؤسسّ لشركة ماجيك كوادرانت. وهي شركةٌ رائدةٌ في مجال أبحاث 
واستشارات تقنية ا معلومات للتداول العَلّني في الولايات المتحدة بعائدات سنوية تجاوزت ۲ مليار 
دولار في عام ۲۰۱۵م. cá asl as‏ في عام 1915م: وكان لديها آنذاك ۷٠٠١‏ شريك» ما في ذلك 
٠١‏ محلل واستشاري أبحاث والعديد من العملاء في ٩١‏ دولة. ig‏ ماجيك كوادرانت أسلوبَ 
بحث قام بتصميمه وتنفيذه جارت نر بمتابعة وتقييم التقدّم الحاصل ومراكز الشركات في سوق 
مُحدّدة قائمة على التقنية. ومن خلال تطبيق العالجة الرسومية ومجموعة مُوخّدة من معايير 
التقييم» وتساعد ماجيك كوادرانت المستخدمين على فهم كيفية تقييم مُقدّمي التقنية في السوق. 

قامت غارتئر بتغيير اسم ماجيك كوادرانت من «منصات ذكاء الأعمال» إلى «منصات ذكاء 
الأعمال والتحليلات»؟ للتأكيد على الأهمية المتزايدة لقدرات التحليلات لنظم المعلومات التي تبنيها 


MY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصقية :)١(‏ طبيعة البيانات» التمذجة الإحصائيةء تصوير البيانات 


المنظمات الآن. تحَدَّد iah Bgu öjt‏ ذكاء الأعمال والتحليلات كمنصة برمجية تقوم بتوفير 
0 إمكانية عبر ثلاث فئات» وهي: التكاملء وتسليم المعلومات» والتحليل. تمن هذه الإمكانيات 
المؤسسات من بناء أنظمة دقيقة للتصنيف والقياس؛ بغرض دعم صُنع القرار وتحسين الأداء. 

ويُوضّح الشكل 7-7 أحدث نظام لماجيك كوادرانت الخاص بمنصات ذكاء الأعمال والتحليلات. 
إذ تضع ماجيك كوادرانت مُقدّمِي الخدمات في أربع مجموعات (اللاعبين المتخصّصينء وأصحاب 
التحَدّيء والحالمين» والقادة) على محورين هما: اكتمال الرؤية (المحور السيني) والقدرة على 
التنفيذ (المحور الصادي). وكما يظهر كوادرانت بشكل واضح؛ فإن معظم مُقدّمي 181/84 
المعروفين جِيدًا يم وضعهم في فئة «القادة» في حين يتن وضُع العديد من مُقدّمِي الخدهات 
الناشئة الأقل شهرةً والجديدة نسبيًا في فئة «اللاعبين المتخصصين». 

يبدو أنَّ التحول في سوق منصة ذكاء الأعمال والتحليلات مُتعرّد السنوات من التقارير التي 
تقودها تقنية المعلومات إلى تحليلات الخدمات الذاتية التي تقودها الشركات قد اجتاز نقطة التحول. 
إن معظم عمليات الشراء الجديدة هي من منصات التحليلات المرئية الحديثة المرتكزة على الأعمال 
التجارية؛ مما يؤدي إلى فرض منظور سوقي جديدء يعمل على إعادة ترتيب وجهة نظر البائعين 
بشكل ملحوظ. إِنَّ معظم النشاط في سوق منصة ذكاء الأعمال والتحليلات هو من المؤسسات 
التي تحاول رفع قدراتها التصويرية والانتقال من النسق الوصفي إلى مستويات التحليلات التنبؤية 
وا مفروضة. وقد رڭز البائعون في السوق بشكل كبير على تلبية طلب المستخدم. وإذا كان هناك 
d uolo ia‏ اء :581014 فسيضيح اكتنشاف/ تصويواالقائات خو قن الهفدسة الأعمازيةالساقل: 
وفي الوقت الذي يعمل فيه مُورّدو اکتشاف/ تصویر البیانات» مثل: 11٥٩٦‏ ونا ومایکروسوفت 
dle (Microsoft)‏ ترسيخ مراكزهم كقادة لكوادرانت: يحاول آخرون (سواءً من مُقدّمِي الحلول/ 
الأدوات الناشئين والكبار أو الراسخين) الانتقال من طور أصحاب الرؤى إلى طور القادة. 

يستمر هذا التركيز على اكتشاف/ تصوير البيانات من معظم القادة وأصحاب الرؤى في السوق 
- التي تعمل الآن على تعزيز الأدوات مع تكامل البيانات سهلة الاستخدام من جانب الشركات» إلى 
جانب التخزين المُدمَجِ وطبقات الحوسبة والحفر غير المقيّد - في تعجيل الاتجاه نحو اللامركزية 
وتمكين المستخدم من ذكاء الأعمال والتحليلات. ويُعضّد إلى uS X&‏ قدرة المنظمات على إجراء 


تحليلات تشخيصية. 


Source: Gartner Magic Quadrant, released on February 4, 2016, gartner.com (accessed 


August 2016). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yr‏ 


الفصل الثاني 











= = — o 5 
القادة أصحاب التحدى‎ 
On ou 
» — RODE ue al 
Qe 
س‎ Qvo 
f snio @ e 
€» 
A. rame Analyt O 5 un 
3 loan @ Que 
4 m 
3| اللاعيون الجيدون‎ nd رؤى‎ 
إعتبارا من فبراير 2016 جه إكتمال الرؤية‎ 


Sò Olat Magic Quadrant :Y-YY Jà‏ الأعمال والتحليلات 

التحليلات المرئية: 
تُعرّف التحليلات المرئية بأنها عبارة عن مصطلح تمَّ صياغته مؤخرًا وغالبًا ما يُسِتَخدّم بشكلٍ لا 
يعني شينًا أكثر من التصوّر المعلوماقي. والمقصود بالتحليلات المرئية؛ هو مزيجٌ من تصوير البيانات 
والتحليلات التنبؤية. ففي حين يهدف تصويرٌ المعلومات إلى الإجابة عن الأسئلة التالية: «ماذا 
حدث؟» و«ما الذي يحدث؟» ويرتبط ارتباطًا وثيقًا بذكاء الأعمال (التقارير الروتينية» وبطاقات 
الأداءء ولوحات ال معلومات)ء في حين تستهدف التحليلات المرئية الإجابة عن الأسئة: «لماذا يحدث 
هذا؟» و«ما هو الاحتمال الأكبر أن يحدث؟» وعادةً ما يرتبط بتحليلات الأعمال (التوقع» التقسيم 
إلى قطاعات. تحليل الارتباط). ويضيف العديدٌ من مُورّدي تصوير المعلومات القدرات التي 
تجعلنا نطلق عليهم اسم مُوفْرِي حلول التحليلات المرئية. يقترب معهد 545 - وهو أحد كبار 
مزوّدي حلول التحليلات منذ فترة طويلة - من اتجاه آخر؛ فهم يدمجون قدراتهم التحليلية في 


ME‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائيةء تصوير البيانات 


بيئة تصوير بيانات عالية الأداء والتي يُطلقون عليها التحليلات المرئية. ولا يختلف إعدادُ تقارير 
الأعمال كثيرًا عن سرد القصة من حيث كونه مرئيًا أو غير مرثيء آلا أو يدوي عبر الإنترنت أو على 
الورق. وتعرض الرؤية الفنية ٠-١‏ وجهة نظر مختلفة وغير تقليدية لتحسين تقارير الأعمال. 
رؤية فنية Y-Y‏ 
سرد قصص عظيمة باستخدام البيانات والتصوير المرئي 

تلك كل مَنْ لديه بيانات لتحليلها قصضًا ليرويهاء سواء كانت تش ص أسباب الخلل في 
التصنيع. أو تبيع فكرةً جديدةً بطريقة تعكس خيال الجمهور ال مستَهدّفء أو تعطي الزملاء 
فكرةً عن برنامج تحسين خدمة عملاء معين. وعندما يتمّخّض سَرْد قصة ما عن خيار إستراتيجي 
كبير منك نت وفريق الإدارة العليا التابع لك من اتخاذ قرار قوي؛ ذإنَّ تقديم قصة تستندٌ 
إلى الواقع قد يكون أمرًا صعبًا للغاية. وفي جميع الحالات؛ فهي مهمة كبيرة. فعليك أن تكون 
القصة مثيرةً للاهتمام وعالقةً بالذاكرة. فأنت تعلم أنك بحاجة إلى أن ثبقي الأمر بسيطًا على 
مديريك التنفيذيين والزملاء المشغولين. ولكنك تعلم أيضًا أنه ينبغي لك أن تكون واقعيًا وموجَهًا 
بالتفاصيل. وأن تكون مشغولًا بالبيانات: لا سيما في عام اليوم الذي يركّز على المقاييس. 

إن لتقديم البيانات والحقائق متعةً فائقةً. ولكن عندما يتم إغراق الزملاء والإدارة العليا 
بالبيانات والوقائع دون سياق؛ فذلك يُعَدُ خسارةً بلااشك. لقد قمنا جميعًا بتجربة عروض 
تقدهية باستخدام طبقات الشرائح الكبيرةء فقط لنكتشف أن الجمهور غارق في البيانات لدرجة 
أنهم لا يعرفون ما يفكّرون به أو أنهم بالكامل لا يأخذون سوى جزء بسيط من النقاط الأساسية. 

ابدأ في إشراك فريقك التنفيذيء وشَرْح إستراتيجياتك ونتائجك بقوة أكبر من خلال الاقتراب من 
مهمتك كراوي. ستحتاج إلى إجابة سؤال: «ما هي قصتك؟» (الحقائق والبيانات)؛ ولكنك ستحتاج 
tá‏ إلى a‏ من نوع: «من؟» و«كيف؟» و«ماذا؟» والسؤال الذي يفتقده الجمهور غالبًا هو: 
«ثم ماذا؟»» إنها عناصر القصة التي ستجعل بياناتك ذات صلة وملموسة لجمهورك. إن إنشاء 
قصة جيدة من شأنه مساعدة الإدارة العليا في التركيز على ما هو مهم. 


لماذا قصة؟ 


القصص تنفحٌ الروح في الحقائق والبيانات وتجعلها حية. كما يمكن أن تساعدك القصة على 
فهم البيانات وترتيبها من خلال مجموعة متباينة من الحقائق. فهي تجعل من السهل تذكر النقاط 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Mo‏ 


الفصل الثاني 


الأساسية» وهكن أن ترسم صورةً حيةً لما يمكن أن يبدو عليه المستقبل. كما تعمل القصصٌ أيضًا على 
خَلْق نوع من التفاعل؛ بحيث يضع كل واحدٍ من الجمهور نفسه في القصة, ويبدأ التعامل مع الموقف. 

تستخدم الثقافاتُ منذ زمن طويل السرد القصصي؛ لتمرير المعرفة والمحتوى. Spa diis‏ 
القصص في بعض الثقافات أمرًا حيويًا لهويتهم. فعلى سبيل المثال: في نيوزيلندا؛ يقوم بعض 
شعوب الماوري بوشم وجوههم بالموكوس. والموكوس هو وشم للوجه يحتوي على قصة عن قدماء 
القبائل والعائلات. قد يكون لدى الرجل تصميعٌ وشمي على وجهه يُظهر ملامح رأس مطرقة 
لتسليط الضوء على الصفات الفريدة المتعلقة بتَسّبه. ويُعبّر التصميمُ الذي يختاره عن جزء من 
«ذاته الحقيقية» ووطن أسلافه. 

True» (Rol JU 2I oleo عندما نحاول أن نفهم قصةً ماء يتنقل راوي القصة‎ Jibbs 
وإذا كانت الإدارة العليا تتطلّع إلى مناقشة كيفية استجابتها في المستقبل للتغييرات‎ . 
التنافسية؛ فإن القصة الجيدة يمكن أن تكون ذات معنّى ومُنقّاة من الكثير من الضوضاء. فعلى‎ 
سبيل امثال: قد يكون لديك حقائق وبيانات من دراستين؛ إحداهما تتضمّن نتائج من دراسة‎ 
إعلانية والأخرى من دراسة حول الرضا عن المنتج. إن تطوير قصة يا قمت بقياسه في كلتا‎ 
الدراستين يمكن أن يساعد الأشخاص على الحصول على رؤية كلية في الوقت الذي تُوجَّد فيه أجزاء‎ 
متباينة. ولجَمْع المُورّعين حول منتج جديد. يمكنك استخدامٌ قصة لإعطاء رؤية لما يمكن أن يبدو‎ 
عليه المستقبل. والأهم من ذلك أن الشَّرد القصصي تفاعاييٌ فعادةً ما يستخدم مُقدَّم البرامج‎ 
les كلماتٍ وصوراً يمكن لأفراد الجمهور وَضْع أنفسهم فيها. ونتيجةٌ لذلك؛ يصبحون أكثر‎ 
بالمعلومات وأفضل فهمًا لها.‎ 


إِذّا ما هي القصة الجيدة؟ 


تمكن لمعظم الناس بسهولة حفظ وترديدٌ es‏ فيلمهم/ كتابهم المفضل. أو يتذكرون Šas‏ 
مضحكةً شاركها أحد الزملاء مؤخرًا. لماذا يتذكر الناسٌ هذه القصص؟ لأنها تحتوي على صفات 
مميزةً معينة. أولًا: تحتوي القصة الجيدة على شخصيات عظيمة. وقد يكون لدى القارئ أو 
الُشاهد في بعض الحالات خبرةٌ غير مباشرة عندما يصبح مشاركًا في الشخصية. والتي (أَيْ: 
الشخصية) تواجه بعد ذلك تحديًا صعبًا؛ ولكنه قابلٌ للتصديق. ويجب أن تعترض طريق الشخصية 
بعض عقبات؛ ولكنها تتخطاها. وأخيرًً؛ وبنهاية القصة تكون النتيجة واضحةً أو التخمين بها 
ممكن. وقد لا يتم حل الموقف - ولكن لا بُدَّ للقصة من نقطة نهاية واضحة. 


15 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


فكّر في تحليلك كقصة - استخدم هيكل قصة: 
عند صياغة قصة غنية بالبيانات؛ يكون الهدفٌ الأول هو العثور على القصة. مَنْ هم الشخصيات؟ 
ما هي الدراما أو التحَدّي؟ ما هي العقبات الواجب تخطيها؟ وفي نهاية قصتك؛ ما الذي تريد من 
هوك فغ ةق وبمجرد معرفة لَب القصة, قُمْ بتركيب باقي عناصر قصتك؟ أَيْ: 
حَدد شخصياتك» افهم التحَذَّيء وحَدّد العقبات» ثم قم ببلورة النتيجة أو سؤال القرار. تأكّد من 
أنك واضحٌ بما تريد أن يفعله الناس كنتيجة لذلك. وسيّجِسّد هذا كيفية استرجاع الجمهور لقصتك. 
ثم باستخدام عناصر القصة, قم بكتابة القصة المصوّرة. والتي تمن هيكل وتكوين قصتك. deg‏ 
الرغم من أن تخَطّي هذه الخطوة ممتعٌ للغاية؛ فإنه من الأفضل أولًا فهم القصة التي ترويهاء 
ومن ثم ]$55 على بنية وشكل العرض. وجرد وَضع لوحة العمل في مكانهاء ستقع بقية العناصر 
الأخرى في مكانها كذلك. وستساعدك لوحة العمل على التفكير في أفضل المجازات أو الاستعارات» 
وعلى تحديد التحَدَّي أو الفرصة بوضوح. وأخيراء ستساعدك على رؤية التدفق والتحؤلات اللازمة. 
وستساعدك لوحة العمل أيضًا على التركيز على العناصر المرئية الأساسية (الرسوم والمخططات 
البيانيةء والجرافكس) التي تحتاج إلى استرجاع بواسطة الموظفين الإداريين لديك. ويُوضح الشكل 
76-7 قصة تأثير القروض الصغيرة من وجهة نظر عايلية داخل بيئة التحليلات المرئية في "Tableau‏ 
باختصارء لا تخف من استخدام البيانات لسَرْد قصص عظيمة. ومن الأهمية بمكان أن تكون 
القصة واقعيةٌ وقائمةً على التفاصيل وموجهةً بالبيانات في العام المرتكز على القياس في هذه الأيام؛ 
ولكن ليس بالضرورة أن تكون مملًا وطويلًا. وفي الواقع» يمكنك من خلال إيجاد القصص الحقيقية 
في بياناتك ومتابعة أفضل الممارساتء كَسْبٍ أشخاص للتركيز على رسالتك - وبالتالي على ما هو 
مهم. وفيما يلي أفضل تلك الممارسات: 
-١‏ فكّر في تحليلك كقصة» استخدم هيكل قصة. 
Bİ gaS uii G S Gya $ -Y‏ 
ع- اجعل الأمرّ سهلًا على جمهورك وعلى نفسك. 
seo 425-0‏ واجر مناقشةً مباشرة. 
Source: Fink, E., & Moore, S. J. (2012). Five best practices for telling great stories with data. White paper‏ 
by Tableau Software, Inc., www:tableau.com/whitepapers/telling-data-stories (accessed May 2016).‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري say‏ 


الفصل الثاني 


I‏ قروض صغيرة: أثر كبير 


^" 
| Romam x — ioco. 
ru 





Lm Anil Cnr 


onn يا مسمس‎ are 





monte KAR 











———- 


Tableau eU» $ £a Jyo pga :YE-Y JSS 

بيئات تحليلات بصرية عالية القوة: 

نظرًا للطلب المتزايدٍ على التحليلات المرئية المقترنة بأحجام البيانات السريعة النمو؛ فهناك 
تحرّك حثيث باتجاه الاستثمار في أنظمة تصوير البيانات ذات الكفاءة العالية. ومع تحرّكاتهم 
الأخيرة في مجال التحليلات المرئية؛ أصبح معهد 545 العملاق للبرمجيات الإحصائية الآن من بين 
أولئك الذين يقودون هذه الموجة؛ إذ gaito is‏ الجديد. تحليلات845 المرئية uga‏ عالية 
الأداءء وحَلاً مختزناً في الذاكرة؛ لاستكشاف كميات هائلة من البيانات في وقتٍ قصير للغاية (فوري 
تقريبًا). فهي تكن المستخدمين من تحديد الأنماطء وتسليط الضوء على الفرص المؤهلة لمزيدٍ من 
التحليلء ونقل نتائج مرثية عبر تقارير الويب أو منصة متحركةء مثل: الأجهزة اللوحية والهواتف 
الذكية. ويُوضُّح الشكل ١0-7‏ البنية العالية المستوى لمنصة تحليلات 585 المرئية. ويُوجَّد على 
أحد طرفي الهندسة المعمارية» قدرةٌ عالميةٌ على إنشاء البيانات وإمكانيات المسؤول؛ مما يؤدي إلى 
مُستكشفء ومُصمّم تقارير. ووحدات ذكاء الأعمال محمولة قيّمة جدًا؛ مما يوفر بشكلٍ جماعي 
حلاً تحليلياً مرئياً من البداية إلى النهاية. 


MA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


MOBILE BI‏ لك 











شكل 80-7: نظرة عامة على بنية تحليلات 545 اطرئية 
وفيما يلي بعضٌ المزايا الرئيسة المقترحة بواسطة تحليلات 5845 المرئية: 

- تكن جميع ا مستخدمين من استخدام تقنيات استكشاف البيانات والتحليلات سهلة الإجراء؛ من 
أجل تحسين عملية GÈ LS hAl gió‏ تحليلات 545 المرئية أنواعًا مختلفةً من المستخدمين 
من إجراء عمليات استكشاف سريعة وشاملة لجميع البيانات المتاحة. ولا يُفَضَّل أخذ عينات 
لتقليل حجم البيانات. 

- تعمل واجهات الويب التفاعلية سهلة الاستخدام على توسيع جمهور التحليلات» وتمكينه من 
تحصيل رؤى جديدة. كما يمكن للمستخدمين الاطلاع على مزيد من الخيارات» واتخاذ قرارات 
أكثر دقةء والوصول للنجاح بشكلٍ أسرع من ذي قبل. 

- تسيل الإجابة عن الأسئلة ا معقدة بشكل أسرع» وتعزيز مساهمات موهبتك التحليلية؛ إذ 
تدعم تقنية تحليلات 545 المرئية عملية اكتشاف البيانات واستكشافها من خلال توفير نتائج 
فائقة السرعة؛ لتمكين إجراء تحليل أفضل وأكثر تركيرًا. ويمكن للمستخدمين المحتّكين تحليليًا 
تحديدٌ مجالات الفرص أو التهديدات المتعلقة بالكميات الكبيرة من البيانات؛ بحيث يمكن 
تحقيق مزيد من التحليلات بسرعة. 

- تُحسّن مشاركة المعلومات والتعاون. فيّمكن لأعداد كبيرة من المستخدمينء بما في ذلك ذوو 
المهارات التحليلية المحدودة؛ عَرْضُ التقارير والرسوم البيانية والتفاعل معها بسرعة عبر الويب 
وملفات Adobe PDF‏ 3545715 1024 المحمولة؛ في حين تحافظ تقنية المعلومات على التحكّم 
في البيانات الأساسية والأمان. وبذلك توفر تحليلات 545 المرئية المعلومات المناسبة للشخص 
المناسب وفي الوقت المناسب لتحسين الإنتاجية وامعرفة التنظيمية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 15 








الفصل الثاني 


- تُحرّر تقنية المعلومات من خلال مَنْح المستخدمين طريقةً جديدة؛ للوصول إلى المعلومات التي 

يحتاجون إليها. وأيضًا تحرير تقنية المعلومات من وابل المطالب المستمر من المستخدمين 

الذين يحتاجون إلى الوصول إلى كمياتٍ مختلفة من البيانات» ووجهات نظر مختلفة للبياناتء 

وتقارير مُعدَّة لغرض معين» وطلبات المرة الواحدة للحصول على المعلومات. 

ق تقنية المعلومات من تنزيل البيانات وإعدادها بسهولة لعدّة مستخدمين. فبمجرد 

تنزيل البيانات lale‏ متاحةً؛ هكن للمستخدمين استكشاف البيانات بحيوية وإنشاء التقارير 

ومشاركة المعلومات بمفردهم. 

- تُوفّر مساحةً للنموٌ بوتيرة مُحدَّدة ذاتيًا. كما توفر تحليلات 545 المرئية خيار استخدام أجهزة 
قاعدة البيانات للسلع المقدّمة 54 .lal;3s EMC Greenplum‏ .485 تمّ تصميمه من الألف 
إلى الياء؛ لتحسين الأداء وقابلية التوسّع لتلبية احتياجات أيّ منظمة باي حجم. 


ويعرض الشكل ١5-١‏ لقطة شاشة لمنصة تحليلات 5485 المرئية؛ إذ يتم تصوير التنبؤ بالسلاسل 
الزمنية وفاصل من الثقة حول التوقعات. 


Product Sale. Product Cost of Sale by Facility Region Correlation cf selected measuus 
MA NORTH ب[ مود وعم‎ 
AMERICA Esci Enel De 
ح١‎ © © © © Proguct يلاما‎ - ` Teve: GEN Sal 
0 e . Product Ovalt; - |Measase: Sales Rep R3 
9 e ?» Ssesmepc. jComeimton:2 562 
e 6 Saa Reoip Relasonship: Svona 
مع‎ ٠ © © 0 ie 
eo Wa. 9 ? Unt Capscty 
e“. uni! Distards | 
. . Jet Lifespan 
e Unt Sas C 
2 Unt iid Rate الل‎ 


$ 9ewacoo| ME #' مدسصمم نم‎ ee cum 
an an 5 ansu | mak Stong 15109100 
Irion! 








[dd ۰ مت ر‎ Feu nk 9M - Revenue & Cost š.p 


Forecast of Product Sale, Product Material Cost by. mist ب‎ PIE A 
Transaction Month 


ii‏ ا 


AeriUUT AegiO08 Dec200$ ADD! Augini2 
fS Transacien Mon | 





2m 
LL | 


vi 
L Podu Malema Cost È B Podat Eso (285 contiten | Brot Cono Sue. M Prod: Sal 








شكل 75-7: لقطة شاشة من تحليلات 545 اطرئية 


Ye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائية. تصوير البيانات 


أسئلة مراجعة على القسم :٠١-۲‏ 

-١‏ ما الأسبات الرئيسة وراء النشآة الحديثة للتحليلات المرئية؟ 

-Y‏ انظر إلى Q4٤‏ ءiعةN‏ ممنصّات ذكاء الأعمال والتحليلات. ماذا ترى؟ ناقش وعلل ملاحظاتك. 
- ما الفرق بين تصوير المعلومات والتحليلات المرئية؟ 

-٤‏ اذا يجب أن يكون سرد القصص جزءً! من إعدادك للتقارير وتصويرك للبيانات؟ 

-٥‏ ما هي بيئة التحليلات المرئية عالية الأداء؟ وطاذا نحتاجها؟ 


۱١-۲‏ لوحات المعلومات: 

Slog) iS‏ المعلومات من المكوّنات الشائعة لمعظم منصات ذكاء الأعمال أو تحليلات الأعماله 
إن م يكن لها جميعًاء وكذلك أنظمة إدارة أداء الأعمالء ومجموعة برامج قياس الأداء. توفّر لوحات 
المعلومات عروضاً مرئيةٌ لمعلومات مهمة يتم توحيدها وترتيبها على شاشة واحدة؛ بحيث يمكن 
استيعابٌ تلك المعلومات في لمحة واحدة وفحصها بسهولة واستكشافها بشكل أكبر. تظهر لوحة 
التحكّم النموذجية في الشكل 7-/7. وتعرض لوحة المعلومات التنفيذية هذه مجموعةًٌ متنوعةً من 
مؤشرات الأداء الرئيسة (1>215) لشركة برمجيات افتراضية تُسمَّى 5002612 (لبيع الأدوات الصوتية). 
كما ea‏ تلك اللوحة عرضًا عالي المستوى للمجموعات الوظيفية المختلفة المحيطة بامنتجات؛ بدءًا 
من نظرة عامة إلى جهود التسويق والمبيعات والتمويل وإدارات الدعم. JS Gags‏ هذا إلى إعطاء 
صانعي القرار التنفيذيين فكرةً سريعةً ودقيقةً عمًا يجري داخل المنظمة. على الجانب الأيسر من 
لوحة المعلومات؛ يمكننا أن نرى (بطريقة السلاسل الزمنية) التغييرات ربع السنوية في الإيرادات 
والنفقات وهوامش الربح» وكذلك مقارنة هذه الأرقام بالأرقام الشهرية للسنوات السابقة. في الجانب 
العلوي الأمن؛ نرى وجهين مع مناطق مشفرة بالألوان يعرضان مقدار النفقات الشهرية لخدمات 
الدعم (الاتصال الهاتفي على اليسار) ومقدار النفقات الأخرى (الاتصال الهاتفي على اليمين). كما 
يشير الترميز اللونيء وعلى الرّغم من أن نفقات الدعم الشهرية تقع ضمن النطاقات العادية؛ Ol‏ 
النفقات الأخرى تقع في المنطقة الحمراء؛ مما يشير إلى القيم المفرطة. وتوضْح الخريطة الجغرافية 
في أسفل اليمين توزيع المبيعات على مستوى البلد في جميع أنحاء العالم. تُوجَّد خلف هذه الرموز 
الرسومية مجموعةٌ متنوعةٌ من الوظائف الرياضية التي تجمع العديد من نقاط البيانات إلى أعلى 
مستوياتها من الأرقام ذات المعنى. من خلال النقر على هذه الرموز الرسومية» يمكن لمستخدمي 
هذه المعلومات الانتقال إلى مستويات أكثر دقة من المعلومات والبيانات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۲1 


الفصل الثاني 


[Executive Dashboard ج‎ nie 


Specity a date rangas xas. om SE onines ® adn 


kj mers B Perg (semen ver n 








mareza e 
" D sese ron ` we f 
313.900 te 134.200. k Ni 
dz ۶ = 1 - 
I monum 


a 05 ود‎ 09 05 09 0> 09 ub 18 Agr 10 





äus :YV-Y JSS‏ لوحة معلومات تنفيذية 

يتم استخدامٌ لوحات المعلومات في مجموعة متنوعة من الأنشطة التجارية لمجموعة متنوعة 

من الأسباب. فعلى سبيل المثال: في الحالة العملية ۷-۲ ستجد ملخص التنفيذ الناجح لمعلومات 
لوحات المعلومات من قبل فريق دالاس كاوبويز لكرة القدم. 


حالة عملية ۷-۲ 
فریق دالاس کاوبویز يحقق نتائج كبيرة مع تابلوة (Teknion) 55555 (Tableau)‏ 
تأسّس دالاس كاوبويز في عام -197م: وهو فريق كرة قدم أميري محترف ومقره 
في إيرفينغ, تكساس. ويتبع الفريق Sas‏ كبيرٌ من الأندية الوطنية» والتي ربما تكون 
صاحبة أفضل تمثيل بسجل اتحاد كرة القدم الأميري لعدد المباريات المتتالية في الملاعب 
التي تمّ بيعها بالكامل. 
agá‏ 
كان بيل برياكوس - الرئيس التنفيذي للعمليات في القسم التجاري بفريق دالاس 
كاوبويز - وفريقه بحاجة إلى رؤية أكثر وضوحًا في بياناتهم؛ حتى يتمكنوا من تشغيلها 


Yy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


بشكل أكثر ربحية. فتمّ اختيارٌ مايكروس وفت كمنصة أساسية لهذه الترقية بجانب 
عدد آخر من تطبيقات المبيعات والخدمات اللوجستية والتجارة الإلكترونية (لكلّ 
ميجاوات). وتوفّع كاوبويز أن بنية المعلومات الجديدة هذه سوف توفر التحليلات 
والتقارير اللازمة. ولكن لسوء الحظ لم يحدث هذاء ومن ثم بدأ البحث عن أداة قوية 
للتحكّم في المعلومات والتحليلات وإعداد التقارير oja ÅA‏ الفجوة. 

الحل والنتائج: 

UU] 5352 Teknions Tableau (5s ds el‏ إعداد تقارير لوحة ال معلومات 
الفورية» والتي تجاوزت متطلبات كاوبويز. وبشكلٍ plius‏ وممنهج. عمل فريق 
3 جنبًا إلى جنب مع مالكي ومستخدمي البيانات داخل دالاس كاوبويز لتقديم 
كل الوظائف المطلوبة: في الوقت المحَدَّد وفي حدود الميزانية المرصودة. وقال بيل 
لويزي - نائب الرئيس في 1818102: «في وقتِ مبكر من هذه العملية؛ كنا قادرين 
على الحصول على فهم واضح با قد يتطلبه الأمر لتشغيل عملية أكثر ربحيةً بالنسبة 
لكاوبويزء وتُحَدُ هذه الخطوة من العملية خطوةً رئيسةً في «daas G] ga Teknion gg‏ 
ودائمًا ما يقوم بتوزيع أرباح هائلة كلما أحرزت خطة التنفيذ تقدمًا». وأضاف لويزي: 
Js»‏ تأكيد؛ لقد عمل 1016801 عن كنب معنا ومع كاوبويز خلال المشروع بأكمله. 
وقد حرصنا معًا على التأكد من أن كاوبويز يمكنهم تحقيق أهدافهم في إعداد التقارير 
والتحليل في زمن قياسي». 

والآن؛ ولأول مرة يستطيع فريق دالاس كاوبويز مراقبة أنشطته التجارية بالكامل 
بدءًا من التصنيع ووصولًا إلى العميل النهائيء وليس فقط رؤية ما يحدث عبر دورة حياة 
النشاط؛ بل التعمّق أكثر في سبب حدوثها. واليوم» يتم استخدام حل ذكاء الأعمال؛ 
لإعداد تقرير عن أنشطة الأعمال للقسم التجاري وتحليلهاء isi gils‏ المسؤول عن 
جميع مبيعات العلامة التجارية في دالاس كاوبويز. وتشير تقديرات الصناعة إلى أن 
مبيعات كاوبويز تشكّل *٠٠١‏ من جميع مبيعات البضائع في اتحاد كرة القدم الأمريي؛ 
مما يعكس حقيقة أن كاوبويز هو صاحب أكثر حقوق الامتياز الرياضية شهرةً في العام. 

وفقًا لإريك لايء مراسل موقع 6:110:14]نامد00؛ فقد يكون توني رومو وبقية 
فريق دالاس كاوبويز متواضعي المستوى فقط في مجال كرة القدم في السنوات القليلة 
الماضية» ولكن بعيدًا عن الملعب» وخاصة في ميدان التجارة؛ فإنهم يظلون فريقاً أمريكيًا. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


vt 


الفصل الثاني 


أسئلة للمناقشة: 
-١‏ كيف استخدم دالاس كاوبويز تصوير المعلومات؟ 
Lo -Y‏ هو التحَدَّي والحل المقترح والنتائج المتحضّل عليها؟ 
Sources: Lai, E. (2009, October 8). BI visualization tool helps Dallas Cowboys sell‏ 


more Tony Romo jerseys. ComputerWorld; Tableau case study. tableausoftware.com/ 


learn/stories/tableau-andteknion-exceed-cowboys-requirements (accessed July 2016). 


تصميم لوحة المعلومات: 

لاتْحَدُ لوحات المعلومات مفهومًا جديدًا. فيمكن أن تعود جذورها التاريخية على 
الأقل إلى نظام المعلومات التنفيذية في ثمانينيات القرن العشرين. واليوم, تتواجد لوحات 
المعلومات في Js‏ مكان. فعلى سبيل المثال: قبل عدة Forrester Research c3 3 «lg o‏ 
أن أكثر من *6٠‏ من أكبر ٠٠٠١‏ شركة في العام استخدمت هذه التقنية (أنتي آند 
مكجريجور: .)7٠١7‏ ومنذ ذلك الحين؛ يمكننا أن نعتبر بمنتهى الثقة أن هذا الرقم 
قد ارتفع بشكلٍ كبير. وفي الواقع؛ في هذه الأيام سيكون من غير المعتاد رؤية شركة كبيرة 
تستخدم نظامًا لذكاء الأعمال لا يعتمد على لوحات التحكم في الأداء. كما يُقدَّم موقع 
XL Js Dashboard Spy (dashboardspy.com/about)‏ آخر على وجودها في كل مكان. 
ويحتوي الموقع على أوصاف ولقطات شاشة لآلاف من لوحات المعلومات ذكاء c3; s Jie‏ 
النتائج: وواجهات ذكاء الأعمال المُستَخدّمة من قبل الشركات من جميع الأحجام والصناعات» 
والمنظمات غير الرُبحية: والوكالات الحكومية. 

وفقاً ل (2006) Cckerson‏ 523 خبيرٌ معروفٌ في ذكاء الأعمال بشكل عام ولوحات المعلومات على 
وجه الخصوص؛ فإن الخاصية الأكثر ميا في لوحة المعلومات هي ممتعها بثلاث طبقات من المعلومات: 
-١‏ المراقبة: البيانات الرسومية المُستخرّجة لرَصْد مقاييس الأداء الرئيسية. 
؟- التحليل: تلخيص البيانات ذات الأبعاد لتحليل السبب الجذري للمشكلات. 
“- الإدارة: تفصيل البيانات التشغيلية التي تِحَدَّد الإجراءات التي يجب اتخاذها لحل مشكلة ما. 

بسبب هذه الطبقات؛ فإن لوحات المعلومات تحوي الكثير من المعلومات في شاشة واحدة. 
ووفقاً ل (2005) «Few‏ «يتمثل التحَدَّي الأساسي لتصميم لوحة المعلومات في عرض جميع المعلومات 
المطلوبة على شاشة واحدة بوضوح وبدون تشتيت» بطريقة يمكن استيعابها بسرعة». ولسرعة 


ع ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


استيعاب الأرقام؛ يلزم وَضع الأرقام في السياق. ويُكن القيام بذلك عن طريق مقارنة الأرقام محل 
الاهتمام بالأرقام الأخرى الأساسية أو امس تَهدّفة؛ وذلك بالإشارة إلى ما إذا كانت الأرقام Hw‏ أم 
سيئة» عن طريق معرفة ما إذا كان الاتجاه أفضل أم أسواأً. وباستخدام أدوات أو عاضر غرض 
متخصصة لوضع السياق النسبي والتقديري. وتشتمل بعض المقارنات الشائعة التي يتم إجراؤها 
عادةً في أنظمة ذكاء الأعمال غلل شارات مع القيم السابقة والمتوقعة و والقياسية أو 
القيم المتوسطة والمتعددة لنفس القياسء وقيّم المقاييس الأخرى (مثل: الإيرادات مقابل التكاليف). 
وحتى مع القياسات النسبية» من امهم أن نشير على وجه التحديد ما إذا كان رقمٌ معينٌ جيدًا أم 
o‏ وما إذا كان متجمًا في الاتجاه الصحيح أم لا. وبدون هذه الأنواع من الدّلالات التقييميةء قد 
يستغرق الأمرُ وقنًا طويكًا لتحديد حالة رقم ما أو نتيجة معينة. وعادة؛ يتم استخدامٌ أيّ كائنات 
مرئية متخصصة (مثل::[شارآت اطرون» والمفاتيح. وا لعازير) أو cola‏ اللرثية (مقل: رميز الألوآن) 
لتعيين السياق التقديري. ويبرز في الحالة العملية ۸-۲ Jo‏ تفاعليٌ لاستكشاف بيانات التقارين 
يقوم Jod lia‏ على لوحة المعلومات» وقد تم بناؤه بواسطة شركة طاقة. 


حالة عملية A-Y‏ 
تساعد التحليلات المرئية مورد الطاقة في عمل روابط أفضل 

تشهدٌ أسواق الطاقة في جميع أنحاء العالم تغيرًا وتحؤلًا كبيرين؛ مما يصنع فرضًا 
كبيرةً إلى جانب تحَدَّيات كبيرة. وكما هو الحال في أيّ صناعة: تجتذب الفرصٌ عددًا 
أكبر من اللاعبين في السوق؛ مما يزيد المنافسة: Jl‏ من مستوى التفاوت في اتخاذ 
القرارات التجارية بشكلٍ أقل من المثالية. ويتطلّب النجاح إنشاء ونشر معلومات 
دقيقة وفي الوقت المناسب وتقدهها إلى أيّ شخص: وكلما دعت الحاجة. فعلى سبيل 
المثال: إذا كنت بحاجة إلى تد JS gis‏ من ميزانيات التسويق بسهولة» والتوازن بين أحمال 
عمل الموظفين» اا العملاء برسائل تسويقية مُخصّصة؛ فستحتاج إلى ثلاثة حلول 
مختلفة لإعداد التقارير. تقوم شركة Jde g U5 ÍS Electrabel GDF SUEZ‏ 
وحدة أعمال التسويق والمبيعات الخاصة بها مع منضّة تحليلات 545 المرئية 

إن نهج الحلّ الواحد هو WS SSS‏ للوقت ممحترفي التسويق في صناعة تشهد تغيراً 
هائلاً. يقول داني نوب -مدير إعداد التقارير والتطوير في وحدة أعمال التسويق والمبيعات 
Electrabel à‏ «إنه تَحَذَّ كبير لاستقرار مركزنا السُوقي في سوق الطاقة. ويشملٌ ذلك 
الحجمّ والأسعارٌ وهوامش الرّبح لكل من عملاء التجزثة والأعمال التجارية». dis‏ هذه 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري y.o‏ 


الفصل الثاني 


الشركة أكبرَ مورد للكهرباء في بلجيكا وأكر منت ج للكهرباء في ÍS‏ من بلجيكا وهولندا. 
يقول نوب: «إنه من الأهمية بمكان أن تزيد 361اء116 من كفاءة اتصالات عملاتها؛ 
إذ إنها تستكشف القنوات الرقمية الجديدة وتطوّر خدمات جديدة متعلقة بالطاقة». 

ويضيف نوب: «كلما عرفنا العملاء بشكل أفضل؛ كان احتمالٌ نجاحنا أكبر. وهذا 
هو السببٌُ في أننا نجمع المعلومات من مصادر متنوعة» مثل: حركة الهاتف مع العميلء 
والأسئلة عبر الإنترنت» والرسائل Anail‏ وحملات البريد. وستٌشْكّل هذه ا معرفة المعرّزة 
لعملائنا وقاعدة العملاء المحتملين مَيْرْةَ إضافيةٌ في سوقنا التنافسية». 

نسخة واحدة من الحقيقة: 

کانت ۴1٥٤۳۵۲٤1‏ تستخدم منصات وأدوات متنوعةً لأغراض إعداد التقارير. وقد 
csl‏ ذلك أحيانًا إلى غموض ف الأرقام المذكورة. وقد واجهت المؤسسة أيمًا مشكلات في 
الأداء في معالجة وحدات مستودعات البيانات الكبيرة. تزيل تحليلات 585 المرئية مع 
تقنية الذاكرة الغموض ومشكلات الأداء. يقول نوب: «لدينا الاستقلالية والمرونة للاستجابة 
للحاجة إلى رؤية العملاء وتصوير البيانات داخليًا. وبعد كلّ هذا يُعَذَّ الإعدادٌ السريع 
للتقارير أحد المتطلبات الأساسية للإدارات الموجّهة عمليًا مثل المبيعات والتسويق». 

العمل بشكل أكثر كفاءة, وبتكلفة أقل: 

تسعى تحليلاتٌ 545 المرئية إلى تشغيل عملية تحديث المعلومات في التقارير 
بصورة آلية. فبدلًا من إنشاء تقرير قديم في وقت اكتماله؛ يتم تحديث البيانات لجميع 
التقارير مرةً واحدةً في الأسبوع وإتاحتها على لوحات المعلومات. وف نشر الحلء 
اختارت ۴1۵٤۲۲۵٤1‏ نهجًا تدريجيًا يبدأ بتقارير بسيطة وينتقل إلى تقارير أكثر تعقيدًا. 
وقد احتاج التقريرٌ الأول بضعة أسابيع لبنائه. ثم جاءت بقية التقارير بشكل أسرع. 
وتتضمّن النجاحات ما يلي: 

- تستغرق البياناث التي استغرقت يومين للتحضير الآن ساعتين فقط. 

- مَسّْح رؤية بيانية لفواتير وتكوين الفواتير للعملاء 828. 

- تقرير إدارة عبء العمل من قبل الفرق التشغيلية. مما كن المديرين من تقييم أعباء 
فريق العمل على أساس أسبوعي أو طويل الأجل ويمكّنهم من إجراء تعديلات وفقًا لذلك. 


يقول نوب: «لقد قمنا بتحسين كفاءة أعمالنا بشكل كبير» ويمكننا تقديم بيانات 


Ya‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


عالية الجودةء وتقارير بشكلٍ أكثر تكرارًا وبتكلفة أقل بكثير. وإذا كانت الشركة بحاجة 
إلى تجميع البيانات من مصادر متعددة؛ فهذا أيضًا من السهولة بمكان. كما يمكن إنشاءٌ 
تقارير مرئية» استنادًا إلى هذه البيانات» خلال بضعة أيام» أو حتى بضع ساعات». 


ويضيف: «إنَّ الشركة تُخطّط لمواصلة توسيع رؤيتها في السلوك الرقمي لعملائهاء 
والجمع بين البيانات من تحليلات الويب والبريد الإلكتروني والوسائل الإعلامية للتواصل 
الاجتماعي مع البيانات من أنظمة النهاية الخلفية. وفي النهاية؛ نحن نريدٌ استبدال 
جميع التقارير التي تحتاج إلى عمل مكثف بتحليلات 545 المرئية». وكما يقول نوب 
مضيفًا: إن مرونة تحليلات 585 المرئية أمرٌ بالغ الأهمية لإدارته: «وهذا سيتيح لنا 
امزيد من الوقت للتصَّدَّي للتحَدّيات الأخرى. ونريد أيضًا أن نجعل هذه الأداة متاحةً 
على أجهزتنا المحمولة. وسيس مح ذلك لمديري الحسابات لدينا باستخدام التقارير 
الحديثة والثاقبة والقابلة للتكيّف عند زيارة العملاء. كما يوجد لدينا منضّة لإعداد 
التقارير الموجهة نحو المستقبل للقيام بكلّ ما نحتاجه». 


أسئلة للمناقشة: 
-١‏ طاذا تعتقدٌ أن شركات إمدادات الطاقة من بين المستخدمين الرئيسيين لأدوات 


تصوير المعلومات؟ 
Electrabel pasil iS -Y‏ تصوير المعلومات للنسخة الواحدة من الحقيقة؟ 
۳- ما التحديات التي واجهوها؟ وماذا كان الحل المقترح؟ وما النتائج التي e‏ 
الحصولٌ عليها؟ 
Source: SAS Customer Story, "Visual analytics helps energy supplier make‏ 
better connections" at http://www.sas.com/en us/cus-tomers/electrabel-be.‏ 


html (accessed July 2016). Copyright 6 2016 SAS Institute Inc., Cary, NC, 
USA. Reprinted with permission. All rights reserved. 


ما الذي تبحث عنه في لوحة المعلومات: 


على الرغم من اختلاف أداء لوحات المعلومات والأَطّر الأخرى لتصوير المعلومات؛ فإنها 
جميعها تشترك في بعض الخصائص الشائعة للتصاميم. أولًا: إنها جميعًا ملائمة لنظام ذكاء 
الأعمال الأكبر أو نظام قياس الأداء. وهذا يعني أنَّ البنية الأساسية الخاصة بهم جميعًا هي ذكاء 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري v.v‏ 


الفصل الثاني 


الأعمال أو بنية إدارة الأداء في النظام الأكبر. ثانيًا: Js glas‏ لوحات المعلومات المصمّمة جيدًا 

وتصويرات المعلومات الأخرى بالخصائص التالية (2009 :(Novell,‏ 

- جميعها تستخدم مكوّنات بصرية (مثل: الرسومات البيانية. وأشرطة الأداء. وخطوط المؤشرات» 
والمقاييس, والأمتار. وإشارات المرور الضوئية)؛ لتسليط الضوء - في لمحة واحدة - على البيانات 
والاستثناءات التي تتطلّب اتخاذ إجراء. 

- تُعَذّ جميعها شفافةً للمستخدم: وهذا يعني أنها تتطلّب الحَدَّ الأدنى من التدريب وتكون سهلة 
الاستخدام للغاية. 

- جميعها تجمّع البيانات من مجموعة متنوعة من الأنظمة إلى عَرْضِ واحد وموجز ومُوحَّدٍ للأعمال. 

- إنها جميعًا تمكّن من التمحيص أو الانتقال إلى مصادر البيانات الأساسية أو التقارير؛ مما يوفر 
مزيداً من التفاصيل حول السياق الأساسي النُسبي والتقديري. 

- تُقدَّم جميعها عرضًا حيويًا للعالم الحقيقي مع تحديث البيانات في الوقت المناسب؟ مما يتيح 
للمُستخدم النهائي مواكبة أحدث التغييرات في النشاط التجاري. 

- تتطلّب جميعها القليل من الترميز المُخصّص - إن وجد - لتنفيذه ونشره وصيانته. 


أفضل الممارسات في تصميم لوحة المعلومات: 

إن ترديد العقارات ملقولة «الموقع الموقع الموقع» تُظهر بوضوح أن السّمة الأكثر أهميةً لجزء 
من الملكية العقارية هي المكان الذي تُوجَد فيه. أمّا بالنسبة إلى لوحات المعلومات فالترديدٌ يكون 
«البيانات» البيانات» البيانات». فغالبًا ما تكون البيانات؛ هي أحد أهم الأشياء التي يجبٌ أخذها في 
الاعتبار عند تصميم لوحات المعلومات (2007 ,هأناهع03101). حتى إذا كان مظهرٌ لوحة القيادة 
يبدو احترافيّه وممتعاً من الناحية الجمالية. ويتضمَّن رسومًا بيانية وجداول تمَّ إنشاؤها وفقًا لمعايير 
التصميم ال مرئي المقبولة؛ فمن المهم أيضًا أن تسأل عن البيانات: هل هي موثوقة؟ هل هي في 
الوقت المناسب؟ هل هناك أي بيانات مفقودة؟ هل هي ثابتةٌ عبر جميع لوحات المعلومات؟ فيما 
يلي بعضُ من أفضل الممارسات القائمة على الخبرة في تصميم لوحة المعلومات )2008 .(Radha,‏ 


مؤشرات الأداء الرئيسية مع معايير الصناعة: 


يرغب العديدٌ من العملاء في وقتِ ما في معرفة ما إذا كانت المقاييس التي يقيسونها هي 
المقاييس الصحيحة التي يجبٌ مراقبتها. وفي بعض الأحيان؛ يكتشف العملاءٌ أن المقاييس التي 


۲۰۸ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائيةء تصوير البيانات 


يتتبعونها ليست هي المقاييس اللازم تتبُعها. إن إجراء تقييم للثغرات مع معايير الصناعة يجعلك 
تتوافق مع أفضل الممارسات ف ال مجال. 
لف مقاييس لوحة المعلومات مع البيانات الوصفية السياقية: 
في كثيرٍ من الأحيان عندما يتم تقديم تقرير أو لوحة معلومات/ بطاقة نتائج مرئية لمستخدمي 
الشركات؛ تظل هناك أسئلةٌ بدون إجابة. وفيما يلي بعض الأمثلة على ذلك: 
- ما مصدر هذه البيانات؟ 
- في أثناء تنزيل مستودع البيانات» ما النسبة المئوية للبيانات التي تمّ رفضها أو واجهت مشكلات 
جودة البيانات؟ 
- هل تُقدِّم لوحة المعلومات معلومات «جديدة» أم معلومات «قديمة»؟ 
- متى كانت آخر مرة & فيها تحديثٌ مستودع البيانات؟ 
- ومتی سیتمٌ تحدیثه لاحقًا؟ 
- هل كان من شأن أيّ صفقة عالية القيمة تحريفُ الاتجاهات العامة المرفوضة كجزءٍ من عملية التنزيل؟ 


التحقّق من صحة تصميم لوحة المعلومات بواسطة أخصائي القابلية للاستخدام: 
في معظم بيئات لوحة المعلومات؛ يتم تصميمٌ لوحة المعلومات بواسطة أخصائي أدوات 
دون الأخذ في الاعتبار بمبادئ قابلية الاستخدام. وعلى الرغم من أن مستودع البيانات يكون 
جيد التصميم وقادراً على أن يُحقّق أداءً جيدًا؛ فإنَّ العديد من مُستخدمي الأنش طة التجارية لا 
يستخدمون لوحة المعلومات؛ نظراً لعدم مواءمتها مع المستخدمين (وفقاً لاعتقادهم السائد)؛ مما 
يؤدي إلى سوء اتخاذ بنية أساسية وإلى مشكلات في إدارة التغيير. ويمكن أن يؤدي التحقق المُسبّق 
من تصميم لوحة المعلومات بواسطة أخصائي قابلية الاستخدام إلى تخفيف هذه المخاطرة. 
إعطاء أولويات وترتيب التنبيهات/ الاستثناءات المتدفقة إلى لوحة المعلومات: 
بسبب وجود GLb‏ من البيانات الخام؛ فمن الأهمية مكان وجوذ آلية لدفع الاستثناءات/ 
السلوكيات ال مهمة بشكل استباقي إلى مستهلي المعلومات. ومن الممكن تقنينُ قاعدة الأعمال 
التي تضبط نمط التنبيه محل الاهتمام. كما يمكن أن يتمّ ترميزها في برنامج» باستخدام الإجراءات 
à Sad‏ في قواعد البيانات والتي يمكنها الظهورٌ من خلال جداول الحقائق واكتشاف الأنماط 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۳۹ 


الفصل الثاني 


التي تحتاج إلى انتباه فوري. وبهذه الطريقةء تعثر ا معلومات على مستخدم الأعمال في مقابل 
مستخدم الأعمال الذي يتفحص جداول الحقائق لظهور الأنماط الحرجة. 


إثراء لوحة المعلومات بتعليقات مستخدم الأعمال: 

عندما يتم تقديم نفس لوحة المعلومات إلى عدة مستخدمين؛ فيمكن توفي مربع نص صغير 
يمكنه التقاط التعليقات من وجهة نظر أيّ مُستخدم نهاقي. وبهذا يمكن UJ‏ وَمْعَ علامة على لوحة 
المعلومات لوضع المعلومات في سياقها؛ مع إضافة وجهة النظر إلى 16815 المهيكلة التي يتم تقدهها. 


تقديم المعلومات في ثلاثة مستويات مختلفة: 

ُمكن تقديم المعلومات في ثلاث طبقات حسب تقسيمات المعلومات: مستوى لوحة المعلومات 
المرئيةء ومستوى التقرير الثابت» ومستوى مكعب الخدمة الذاتية. وعندما يتنقل المستخدم في لوحة 
المعلومات» هكن تقديم مجموعة بسيطة من ۸ إلى KPIs \Y‏ مما يعكس انطباعًا حول ما يجري 
بشکل جيد وما هو غير جيد. 


اختيار البنية المرئية الصحيحة باستخدام مبادئ تصميم لوحة المعلومات: 

في عَرْض المعلومات على لوحة المعلومات؛ يتم تقديمٌ بعض المعلومات بشكل أفضل باستخدام 
شريط الرسوم البيانية. وبعضها يكون أفضل مع المخططات البيانية للسلاسل الزمنية» وعند عَرْض 
الارتباطات» يكون مربع التبعثر هو الأفضل. وفي بعض الأحيان مجرد تقديم المعلومات كجداول 
بسيطة يكون أكثر فاعلية. وبمجرد أن يتمّ توثيق مبادئ تصميم لوحة المعلومات بشكلٍ صريح» 
يمكن لجميع المطوّرين الذين يعملون على الواجهة الأمامية الالتزام بنفس المبادئ في أثناء تقديم 
التقارير ولوحة المعلومات. 


توفير التحليلات الإرشادية: 

في منظمة نموذجية؛ يمكن للمستخدمين من رجال الأعمال أن يكونوا على مستويات مختلفة من 
النضج التحليلي. كما يمكن استخدامٌ إمكانية لوحة المعلومات لتوجيه مستخدم الأعمال «متوسط 
المستوى» إلى الوصول إلى نفس مسار التنقل الذي يسلكه مستخدمٌ الأعمال المحنّك بطريقة تحليلية. 


Y‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 


أسئلة مراجعة على القسم IV-V‏ 

-١‏ ما هي لوحة المعلومات؟ وطاذا هي منتشرة جداً؟ 

lo -Y‏ هي عناصرٌ الرسوم البيانية الممستخدّمة عادةً في لوحات المعلومات؟ وماذا؟ 
3l -Y‏ مع الشرح الطبقات الثلاث من المعلومات المصوّرة على لوحات المعلومات. 
-٤‏ ما هي الخصائص المشتركة للوحات المعلومات وغيرها من المعلومات ال مرئية؟ 
-٥‏ ما هي أفضل الممارسات في تصميم لوحة القيادة؟ 


تلخيص لأهمٌ نقاط الفصل: 

- أصبحت البياناتٌ واحدةً من أكثر الأصول قيمة لمنظمات esl‏ 

- تُعَدُ البيانات هي العنصر الرئيسي لأيّ مبادرة ذكاء أعمال. وعلم البيانات» ومبادرة تحليلات الأعمال. 

- على الرّغم من أن القيمة المقترحة لها لا يمكن إنكارهاء وللوفاء بوعودهاء يجبٌ أن تلتزم البيانات 
ببعض المقاييس الأساسية للاستخدام والجودة. 

- تشيرٌ البيانات (المعطاة في صورة مفردة) إلى مجموعة من الحقائق التي يتم Žale lale Jya‏ 
كنتيجة للتجارب أو المشاهدات أو المعاملات أو الخبرات. 

- عند أعلى مستويات الغموض؛ تكن تصنيفٌ البيانات على أنها مهبكلةٌ وغير مهيكلة. 

- لا تكون البيانات في شكلها الأصلي/ الخام جاهزةً عادةً لتكون مفيدةً في مهام التحليلات. 

- تُعَذُ المعالجة المُسبّقة للبيانات مهمةً مُملّةَ ومتطلبةً للوقت؛ ولكنها ضرورية في تحليلات الأعمال. 

- يُعرّف الإحصاءٌ على أنه مجموعةٌ من التقنيات الرياضية لتوصيف وتفسير البيانات. 

- يكن تصنيف الأساليب الإحصائية على أنها إِمّا وصفية أو استنتاجية. 

- تُعَدُ الإحصائيات بشكل عام والإحصائيات الوصفية بشكلٍ خاص جزءًا مهما من تحليلات ذكاء 
الأعمال وتحليلات الأعمال. 

- كن استخدامٌ طرق الإحصاء الوصفي لقياس النزعة المركزية: أو التشتّتء أو شكل مجموعة بيانات معينة. 

- قد يكون الانحدارٌ وخاصةً الانحدار hód‏ هو أكثرُ تقنيات التحليلات شهرةً واستخدامًا في الإحصاءات. 

- يُنظر لكل من الانحدار الخطي والانحدار اللوجستي على أنهما النوعان الرئيسان من الانحدارات في الإحصاءات. 

- يُعرّف الانحدار اللوجستي كخوارزمية تصنيف قائمة على الاحتمالية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YM‏ 


الفصل الثاني 


- تُعرّف السلسلة الزمنية على أنها سلسلة من نقاط البيانات للمتغيرء يتم قياسها وتسجيلها في 
نقاط متتالية من الزمن متباعدة على فترات زمنية مُوخَّدة. 

$S -‏ التقريرُ أيّ عملية تواصل من صُنع الإنسان تمّ تحضيرها بغرضٍِ معين؛ لتوصيل المعلومات 
بصيغة قابلة للتقديم أو العرض. 

- يُعَذَّ تقريرٌ الأعمال مستنداً مكتوباً يحتوي على معلومات تتعَلّق بأمور الأعمال. 

- إن مفاتيح أيّ تقرير تجاري ناجح؛ هي: الوضوح؛ والإيجازء والاكتمالء والصحة. 

- يُكَدُ التصويرٌ المري للبيانات؛ هو استخدامٌ التمثيلات المرئية؛ لاستكشاف البيانات وفهمها وتوصيلها. 

- قد يكون المخطط البياني الأبرز للمعلومات في الماضي؛ هو ذلك الذي طوّرة «Charles J. Minard‏ 
والذي صوّر بيانيًا الخسائر التي تكبّدها جيش نابليون في الحملة الروسية PAY ple‏ 

- تتضَّمّن أنواعٌ الرسوم البيانية الأماسية الرّسم البياني الخَطّيء وشريط الرسم البياني» والرسم 
البياني الدائري. 

- غالبا ما يتم اشتقاق الرسوم البيانية المتخصصة من المخططات الأساسية كحالات استثنائية. 

- إن تقنيات وأدوات عرض البيانات تجعل من مستخدمي تحليلات الأعمال وأنظمة ذكاء الأعمال 
أفضل مستهلكين للمعلومات. 

- تُعرّف التحليلات المرئية بأنها مزيجٌ من التصوير والتحليلات التنبؤية. 

- أذّى ازدي اد الطلب على التحليلات البصرية إلى جانب حجم البيانات سريع النمو إلى نمو هائلٍ 
في استثمارات أنظمة التصوير ذات الكفاءة العالية. 

- توفر لوحات ال معلومات عروضاً مرئيةً معلومات مهمة يتم دَمْجُها وترتيبها على شاشة واحدة؛ حتى 
يمكن استيعاب تلك المعلومات في لمحة واحدة والتعمّق فيها بسهولة واستكشافها بشكلٍ أكبر. 

مصطلحات أساسية: 

التحليلات جاهزة تصوين البيانات الانحدار الخطي بيانات النسبة 

الوسط الحسابي معطيات الانحدار اللوجيستي الانحدار 


box-and-whiskers plot‏ | الإحصاتيات الوصفية | متوسط الانحراف المطلق | التقرير 

















box plot‏ تخفيض الأبعاد الوسيط مربع التبعثر 


vw‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 

















التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائية. تصوير البيانات 

















التحليلات جاهزة تصوير البيانات الانحدار الخطي بيانات النسبة 
الرسم البياني الفقاعي cia‏ المنوال الانحراف 

تقرير الأعمال IÑI gle‏ بيانات اسمية الانحراف ال معياري 
بيانات فئوية الحوسبة تحليلات على الإنترنت |الإحصاء 

المركزية الممدرّج التكراري laklلşة (OLAP)‏ السّرد القصصي 
الارتباط الإحصاء الاستنتاجي | بيانات ترتيبية بيانات مهيكلة 
لوحات المعلومات الأداء الرئيسي "m‏ الصغرى العادية | التنبؤ بالسلاسل الزمنية 
المعالجة المسبقة للبيانات | مؤشر (151) (OLS)‏ بيانات غير مهيكلة 
جودة البيانات المعرفة الرسم البياني الدائري |اختيار المتغير 

أمن البيانات التفرطح الربيع التباين 

تضنيق البيانات التعلّم النطاق التحليلات المرئية 


-١‏ كيف تصف أهمية البيانات ف التحليلات؟ هل هكننا التفكيرٌ في التحليلات بدون بيانات؟ اشرح. 

۲- بالنظر إلى التعريف الجديد والواسع لتحليلات الأعمال؛ ما هي المدخلات وا مخرجات الرئيسية 
لاستمرارية التحليلات؟ 

۳- من gb oÍ‏ بيانات تحليلات النشاط التجاري؟ وما هي مصادرٌ وطبيعة تلك البيانات الواردة؟ 

ع- ما هي المقاييس الأكثر استخدامًا في البيانات الجاهزة للتحليلات؟ 

0- ما هي الفئات الرئيسة للبيانات؟ وما هي أنواعٌ البيانات التي يمكن استخدامها في ذكاء الأعمال والتحليلات؟ 

1- هل مُكننا استخدامٌ نفس تمثيل البيانات لجميع نماذج التحليلات (بمعنى: هل تتطلَّب نماذج 
التحليلات المختلفة مخططًا مختلقًا لتمثيل البيانات)؟ وطاذا؟ أو SY ISU‏ 

۷- اذا لا تكون البيانات الأصلية/ الأوّلية قابلةَ للاستخدام بسهولة بواسطة مهاه التحليلات؟ 

8- ما هي الخطوات الرئيسة لمعالجة البيانات؟ اذكر مع الشرح أهميتها في التحليلات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yw‏ 






































الفصل الثاني 


5 


9- ماذا يعني تنظيف/ فرك البيانات؟ وما هي الأنشطة التي يتم أداؤها في هذه المرحلة؟ 

-٠‏ تمكن تطبيق تخفيض البيانات على الصفوف (أخذ العينات) و/ أو الأعمدة (اختيار متغير). 
أيْهما أكثر Éa‏ اشرح. 

-١‏ ما هي العلاقة بين الإحصائيات وتحليلات الأعمال (مع الأخذ في الاعتبار مكانة الإحصاءات 
من تصنيف تحليل الأعمال)؟ 

-١١‏ ما هي الاختلافات الرئيسة بين الإحصاء الوصفي والاستقرائي؟ 

-١1‏ ما هو 3a box-and-whiskers plot‏ وما هي أنواع المعلومات الإحصائية التي تمثلها؟ 

-٤‏ ما هي خصائص الشكل الأكثر شيوعًا لوصف توزيع البيانات؟ 

-٥‏ اذكر مقاييس النّزعة المركزية للإحصاءات الوصفية» مع تعريف موجز JS]‏ مقياس. 

-١‏ ما هي أوجه الشبه والاختلاف بين الانحدار والارتباط؟ 

۷- اذكر مع الشرح الخطوات الرئيسة لمتابعة التطؤر في نموذج الانحدار الخطي. 

۸- ما هي أكثر الافتراضات الواضحة شيوعًا للانحدار الخطي؟ وما الذي يلزم لنماذج الانحدار 
في مقابل هذه الافتراضات؟ 

5- ما هي أوجه الشبه والاختلاف بين الانحدار الخطي والانحدار اللوجستي؟ 

-١‏ ما هي السّلاسل الزمنية؟ وما هي تقنيات التنبؤ الرئيسية لبيانات السلاسل الزمنية؟ 

-١‏ ما هو تقريرُ العمل؟ وماذا يتم الاحتياجٌ إليه؟ 

iua la -YY‏ أفضل الممارسات في إعداد تقارير الأعمال؟ وكيف كننا جَعْل تقاريرنا تتميّز عن غيرها؟ 

g ål -YY‏ عملية دورة الإدارة مع التعليق على دور تقارير الأعمال. 

-٤‏ اذكر مع الشرح الفئات الرئيسية الثلاثة لتقارير الأعمال. 

-٥‏ لماذا أصبح تصويرٌ المعلومات محوريًا في تحليلات ذكاء الأعمال وتحليلات الأعمال؟ وهل 
هناك فرق بين تصوير المعلومات والتحليلات المرئية؟ 

- ما هي الأنواع الرئيسة من الرسوم/ المخططات البيانية؟ ولماذا يوجد الكثير منها؟ 

۷- كيف يمكنك تحديدٌ الرسم البياني المناسب لكلّ مهمة؟ اشرح وبَرّر إجابتك. 

- ما هو الفرق بين تصوير المعلومات والتحليلات المرئية؟ 

لماذا يجبٌ أن يكون السرد القصصي جزءًا من إعدادك للتقارير وتصويرك للبيانات؟ 


A‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصقية :)١(‏ طبيعة البيانات» التمذجة الإحصائية. تصوير البيانات 


٠‏ ما هي لوحات المعلومات؟ وماذا تعرض؟ 

-١‏ ما هي أفضل الممارسات في تصميم لوحات المعلومات الغنية بالمعلومات؟ 

'- هل تعتقدٌ أن لوحات المعلومات/ الأداء موجودة لتبقى؟ أم هي على وشك التقادم؟ وبرأيك 
ماذا ستكون الموجة الكبيرة التالية في ذكاء الأعمال وتحليلات الأعمال؛ من حيث تصوير 
البيانات/ ال معلومات؟ 


تمارين 
جامعة تيراداتا وغيرها من التمارين اليدوية الأخرى 

-١‏ قم بتنزيل بيانات «سلوك التصويت» ووصف البيانات المختصر من موقع الكتاب على الإنترنت. 
هذه مجموعة بيانات تمّ تجميعها يدويًا من المقاطعات في جميع أنحاء الولايات المتحدة. 
تتم معالجة البيانات جزئيًا أيْ: يتم إنشاء بعض المتغيرات المشتقة. وتتمثل مهمتك في إجراء 
معالجة مسبقة للبيانات من خلال تحديد الخطأ والشذوذ, واقتراح الإصلاحات والحلول. وفي 
النهاية؛ يجب أن يكون لديك إصدارٌ جاهرٌ للتحليلات لهذه البيانات. وبمجرد اكتمال المعالجة 
المسبقة. اسحب هذه البيانات إلى 18616211 (أو إلى أداة برمجية أخرى لتصوير البيانات)؛ 
لاستخراج معلومات مرئية مفيدة منها. وللقيام بذلك؛ قم بِوَضْع الأسئلة والفرضيات ذات 
الضّلة (ابتكر ثلاثةً منها على الأقل). وقم بإنشاء تصويرات ملائمة تتعامل مع تلك الأسئلة ل 
«اختبارات» تلك الفرضيات. 

؟- قم بتنزيل «tableau.com (Jos 53) Tableau‏ باتباع الإرشادات الأكادهية لتنزيل البرامج 
s doll‏ على موقعها). باستخدام مجموعة البيانات Visualization MFG. Sample‏ 
(المتاحة على ملف 1661 على موقع هذا الكتاب). أجب عن الأسئلة التالية: 
-١‏ ما هي العلاقة بين إجمالي إيرادات شباك التذاكر والمعلمات الأخرى المتعلّقة بالفيلم 

الواردة في مجموعة البيانات؟ 
۲- كيف تختلف هذه العلاقة عبر سنوات مختلفة؟ إعداد تقرير مكتوب ذي مظهر احترافي 
ez)‏ تحسينه باستخدام لقطات من نتائجك الرسومية. 

.teradatauniversitynetwork.com d) Jsl -Y‏ ابحث عن مقالة تتناول طبيعة البيانات» 
وإدارة البيانات» و/ أو تقنين البيانات من حيث صلتها بذكاء الأعمال والتحليلات ثم حلّل 
محتوى المقالة بشكلٍ نقدي. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yio‏ 


الفصل الثاني 


ع- انتقل إلى مستودع بيانات Ae gaza 235-5 (archive.ics.uci.edu/ml/datasets.html) UCI‏ 
كبيرةً من البيانات تحتوي على كلّ من القيم الرقمية والقيم الاسمية. باستخدام :11105015 
اءع<ظ أو أيّ برنامج إحصائي آخر: 

-١‏ قم بحساب وتفسير مقاييس النّزعة ال مركزية لكل متغير. 
- قم بحساب وتفسير مقاييس التشتّت/ الانتشار لكلّ متغير. 

5- انتقل إلى مستودع (archive.ics.uci.edu/ml/datasets.html) UCI Ul‏ 55 53 
مجموعتين من البيانات. إحداهما ل التقدير/ الانعدار والأخرى للتصنيف. باستخدام 
ا 211050116 أو أيّ برنامج إحصائي آخر: 

-١‏ قم بتطوير وتفسير نموذج انحدار خطّي. 
؟- قم بتطوير وتفسير نموذج انحدار لوجستي. 

1- انتقل إلى موقع <دمء.]12102118865: وتعرّف على مجموعة موارد التحليلات المتاحة على هذه 
البوابة. ثم حَدَّد مقالة أو ورقةَ بيضاء أو نضًا للمقابلة يتناول طبيعة البيانات» و/ أو إدارة 
البيانات» و/ أو تقنين البيانات؛ من حيث صلتها بذكاء الأعمال وتحليلات الأعمالء ثم حلّل 
محتوى امقالة بشكلٍ نقدي. 

Jil. .[ "The Perceptual Edge" (perceptualedge.com)] «5,3 ستيفن‎ diĝas انتقل إلى‎ -V 
"ata! e L5 d 
مجموعة‎ EU goyr “Digital Dashboard” de äl في الموقع. بعد ذلكء‎ “0116” 
متنوعةً من العروض التوضيحية المختلفة للوحة المعلومات. قم بتشغيل اثنين من هذه‎ 
العروض التوضيحية.‎ 

-١‏ ما هي أنواع المعلومات والمقاييس التي تظهر في العروض التوضيحية؟ وما هي أنواع 
الإجراءات التي يمكنك اتخاذهاة 0 1 

؟- باستخدام بعض المفاهيم الأساسية من نقد iog gÊ Few‏ بعض نقاط التصميم الجيدة 
ونقاط التصميم السيئة للعروض التوضيحية. 

۸- قم بتنزيل أداة لتصوير ال معلومات» مثل QlikView 5l Tableau‏ أو .Spotfire‏ إذا م یکن لدی 
مدرستك اتفاقية تعليمية مع هذه الشركات؛ فستكون النسخة التجريبية كافية لهذا التمرين. 
استخدم بياناتك الخاصة (إذا كان لديك أيٌّ منها) أو استخدم إحدى مجموعات البيانات 
التي تأت مع الأداة (وعادةً ما تحتوي على مجموعة بيانات واحدة أو أكثر لأغراض العرض 


v‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


. اقرأ بعضًا من هذه الأمثلة. اذهب الآن إلى .dundas.com‏ &3» قسم 


التحليلات الوصفية :)١(‏ طبيعة البيانات» التمذجة الإحصائيةء تصوير البيانات 


التوضيحي). قم بدراسة البيانات» وافترض مشكلتين من ابتكارك من مشكلات الأعمالء 
واستخدم التصوير البياني للبيانات لتحليل وعرض هاتين المشكلتين» ثم اقترح حلا محتملًا لهما. 

13l ."Tableau qe5 £37" oe Can) -teradatauniversitynetwork.com :|J Jl -à 
الوصفء نقذ المهامَّ ثم أجب عن الأسئلة.‎ 

o$ C9 .teradatauniversitynetwork.com :,J! J| à3l -V-‏ مهام تحليلات 545 اطرئية. 
باستخدام المعلومات والإرشادات من نوع خطوة بخطوة ال متوفرة في المهمة؛ قم بتنفيذ 
التحليل على أداة وعناتزلهصخ 115131 545 (وهو نظاءٌ يدعم الويب ولا يتطلب أيّ Cas‏ 
محلي). أجب عن الأسئلة المطروحة في المهمة. 

-١‏ ابحث عن مقالتين على الأقل (إحداهما مقالٌ صحفي والآخر ورقةٌ بيضاء) تتحدثان عن 
سَرْد القصصء وخصوصًا في سياق التحليلات (أَيْ: سرد القصص القائم على البيانات). اقرأ كلا 
من المقالة والورقة ثم قُمْ بتحليلهما بشكلٍ نقديء واكتب تقريرًا يعكسٌ فهمك وآراءك حول 
أهمية السرد القصصي في ذكاء الأعمال وتحليلات الأعمال. 

-١١'‏ انتقل إلى 10213.807 - وهي بوابة بيانات ترعاها حكومة الولايات المتحدة - والتي تحتوي 
على ġa li> uS ose‏ مجموعات البيانات حول مجموعة متنوعة من الموضوعات التي تتراوح 
من الرعاية الصحية إلى التعليم والمناخ والسلامة العامة. اختر موضوعًا يشغل بالك BES‏ 
انتقل من خلال المعلومات الخاصة بهذا الموضوع والشرح المقدَّم على الموقع. استكشف 
إمكانيات تنزيل البيانات» واستخدم أداتك المفضلة للتصوير البياني للبيانات لإنشاء معلومات 
ومقاطع مرئية ذات معنّى خاص بك. 


مهام فريق ومشروعات لعب الأدوار: 

-١‏ يبدأ التحليل بالبيانات. إن تحديد البيانات ذات الصّلة والوصول إليها والحصول عليها ومعالجتهاء 
eal ua‏ المهامٌ في أيّ دراسة تحليلية. بصفتك فريقًاء يتم تكليفك بالبحث عن بيانات واقعية 
كبيرة بما يكفي (إما من مؤسستك الخاصةء وهذا هو الخيار الأفضلء أو من الإنترنت والتي يمكن 
أن تبدأ ببحث بسيطء أو من روابط البيانات المنشورة على 11(11886]5.602): والتي لديها 
عشرات الآلاف من الصفوف وأكثر من ٠١‏ متغيرًا لتتناول وتوثق المشروع الشامل للمعالجة 
المسبقة للبيانات. في معالجتك للبيانات؛ حَدّد الشذوذات والتناقضات باستخدام طرق ومقاييس 
الإحصاء iog‏ واجعل تحليلات البيانات جاهزةً. قم بإعداد قائمة مع التبرير لخطوات 
معالجتك المسبقة وقراراتك في تقرير شامل. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yw‏ 


الفصل الثاني 


؟- انتقل إلى 354 55« (dundas.com, idashboards.com, enterprise-dashboard.com)‏ 
والمزوّد بمعلومات لوحة المعلومات المعروفة جيدًا؛ إذ توفّر هذه المواقع عددًا من الأمثلة على 
لوحات التحكّم التنفيذزية. وبصفتك فريقاً اختر صناعةً معينةٌ (مثل: الرعاية الصحية: أو 
الخدمات المصرفيةء أو الخطوط الجوية). حَدّد موقع بعض من الأمثلة للوحات معلومات 
هذه الصناعة. قم بِوَضْف أنواع المقاييس ال موجودة في لوحات المعلومات. ما هي أنواع 
شاشات العرض التي يتم استخدامها لتوفير المعلومات؟ وباستخدام ما تعرفه عن تصميم 
لوحة المعلومات» قم بتوفير نموذج مبدن لورقة لوحة معلومات لهذه المعلومات. 

۳- انتقل .teradatauniversitynetwork.com |J!‏ ومن هناك؛ انتقل إلى مصادر بيانات جامعة 
أركنساس. اختر واحدة من مجموعات البيانات الكبيرةء وقم بتنزيل عدد كبير من السجلات 
(قد يتطلّب ذلك منك كتابة عبارة :501 التي تقوم بإنشاء المتغيرات التي تريد تضمينها في 
مجموعة البيانات). اطرح ٠١‏ أسئلة على الأقل يمكن معالجتها باستخدام تصوير المعلومات. 
ثم باستخدام أداتك المفضّلة لتصوير البيانات (ولتكن 181680): حلل البيانات ثم قم alash‏ 
تقرير مُفصّل يتضمن لقطات شاشة وصور مرئية أخرى. 


YA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات: التمذجة الإحصائيةء تصوير البيانات 


المراجع: 

- Abela, A. (2008). Advanced presentations by design: Creating communication that drives action. New 
York: Wiley. 

- Annas, G. J. (2003). HIPAA regulations—A new era of medical-record privacy? New England Journal 
of Medicine, 348(15), 1486-1490. 

- Ante, S. E., & McGregor, J. (2006). Giving the boss the big picture: A dashboard pulls up everything the 
CEO needs to run the show. Business Week, 43-51. 

- Carotenuto, D. (2007). Business intelligence best practices for dashboard design. WebFOCUS white paper. www. 
datawarehouse.inf.br/papers/information builders dashboard best practices.pdf (accessed August 2016). 

- Dell customer case study. Medical device company ensures product quality while saving hundreds 
of thousands of dollars. https://software.dell.com/documents/instrumentation-laboratory-medical- 
device-companyensures-product-quality-while-saving-hundreds-ofthousands-of-dollars-case- 
study-80048.pdf (accessed August 2016). 

- Delen, D. (2010). A comparative analysis of machine learning techniques for student retention 
management. Decision Support Systems, 49(4), 498-506. 

- Delen, D. (2011). Predicting student attrition with data mining methods. Journal of College Student 
Retention 13(1), 17-35. 

- Delen, D., Cogdell, D., & Kasap, N. (2012). A comparative analysis of data mining methods in predicting 
NCAA bowl outcomes. International Journal of Forecasting, 28, 543-552. 

- Delen, D. (2015). Real-world data mining: Applied business analytics and decision making. Upper 
Saddle River, NJ: Financial Times Press (A Pearson Company). 

- Eckerson, W. (2006). Performance dashboards. New York: Wiley. 

- Few, S. (2005, Winter). Dashboard design: Beyond meters, gauges, and traffic lights. Business Intelligence 
Journal, 10(1). 

- Few, S. (2007). Data visualization: Past, present and future. perceptualedge.com/articles/Whitepapers/ 
Data Visualization.pdf (accessed July 2016). 

- Fink, E., & Moore, S. J. (2012). Five best practices for telling great stories with data. White paper by 
Tableau Software, Inc., www.tableau.com/whitepapers/telling-data-stories (accessed May 2016). 

- Freeman, K. M., & Brewer, R. M. (2016). The politics of American college football. Journal of Applied 
Business and Economics, 18(2), 97-101. 

- Gartner Magic Quadrant, released on February 4, 2016, gartner.com (accessed August 2016). 

- Grimes, S. (2009a, May 2). Seeing connections: Visualizations makes sense of data. Intelligent 
Enterprise.i.cmpnet.com/intelligententerprise/next-era-business-intelligence/Intelligent Enterprise - 
Next Era BI Visualization.pdf (accessed January 2010). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yya‏ 


الفصل الثاني 


- Grimes, S. (2009b). Text analytics 2009: User perspectives on solutions and providers. Alta Plana. 
altaplana.com/TextAnalyticsPerspectives2009.pdf (accessed July, 2016). 

- Hardin, M., Hom, D., Perez, R., & Williams, L. (2012). Which chart or graph is right for you? Tableau 
Software: Tell Impactful Stories with DataCE. Tableau Software. http://www.tableau.com/sites/default/ 
files/media/which chart v6 final 0.pdf (accessed August 2016). 

- Hernández, M. A., & Stolfo, S. J. (1998, January). Real-world data is dirty: Data cleansing and the 
merge/purge prob- lem. Data Mining and Knowledge Discovery, 2(1), 9-37. 

- Hill, G. (2016). A Guide to enterprise reporting. ghill.customer.netspace.net.au/reporting/definition. 
html (accessed July 2016). 

- Kim, W, Choi, B. J., Hong, E. K., Kim, S. K., & Lee, D. (2003). A taxonomy of dirty data. Data Mining 
and Knowledge Discovery, 7(1), 81-99. 

- Kock, N. E, McQueen, R. J., & Corner, J. L. (1997). The nature of data, information and knowledge 
exchanges in busi- ness processes: Implications for process improvement and organizational learning. 
"The Learning Organization, 4(2), 70-80. 

- Kotsiantis, S. B., Kanellopoulos, D., & Pintelas, P. E. (2006). Data preprocessing for supervised leaning. 
International Journal of Computer Science, 1(2), 111-117. 

- Lai, E. (2009, October 8). BI visualization tool helps Dallas Cowboys sell more Tony Romo jerseys. 
ComputerWorld. 

- Novell. (2009, April). Executive dashboards elements of success. Novell white paper. www.novell.com/ 
docrep/documents/3rkw3etfc3/Executive Dashboards Elements of Success White Paper en.pdf 
(accessed June 2016). 

- Quinn, C. (2016). Data-driven marketing at SiriusXM. Teradata Articles & News. at http://bigdata. 
teradata.com/US/Articles-News/Data-Driven-Marketing-At-SiriusXM/(accessed August 2016); 
"Teradata customer success story. SiriusXM attracts and engages a new generation of radio consumers. 
http://assets.teradata.com/resourceCenter/downloads/CaseStudies/EB8597.pdf?processed- 1. 

- Radha, R. (2008). Eight best practices in dashboard design. Information Management. www. 
information-manage-ment.com/news/columns/-10001 129-1.html (accessed July 2016). 

- SAS. (2014). Data visualization techniques: From basics to Big Data. http://www.sas.com/content/dam/ 
SAS/en us/doc/whitepaperl/data-visualization-techniques-106006.pdf (accessed July 2016). 

- Thammasiri, D., Delen, D., Meesad, P, & Kasap N. (2014). A critical assessment of imbalanced 
class distribution prob- lem: The case of predicting freshmen student attrition. Expert Systems with 
Applications, 41(2), 321-330. 


PY.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل الثالث 
التحليلات الوصفية (Y)‏ 
ذكاء الأعمال ومستودعات البيانات 


أهداف التعلّم: 
- فهم التعريفات والمفاهيم الأساسية لمستودعات البيانات. 
- فهم فنيات مستودعات البيانات. 
- وَضْف العمليات المستخدّمة في تطوير وإدارة مستودعات البيانات. 
- شرح عمليات مستودعات البيانات. 
- شرح دور مستودعات البيانات في دَعْم القرار. 
- شَرْح تكامل البيانات» وعمليات الاستخراجء والتحويل والتنزيل (8:11). 
- فَهُم جوهر إدارة أداء الأعمال (822/1). 
- تعلّم بطاقة الأداء المتوازن وستة سيجما كنُظُم قياس الأداء. 
لقد كان مفهومٌ مستودعات البيانات موجودًا منذ أواخر الثمانينيات. Jail lio pii‏ 
o LI‏ لنوع مهم من قواعد البيانات» يُسمَّى مستودع البيانات» والذي يُسِتَخدّم أساسًا لدعم 
القرار ويوفر الأساس المعلوماتي لتحسين القدرات التحليلية. وسنناقش مفاهيم تخزين البيانات 
وما يرتبط بذلك» وكذلك إدارة أداء الأعمال في الأقسام التالية. 
٠-۳‏ مقال افتتاحي: استهداف الاحتيال الضريبي مع ذكاء الأعمال» ومستودعات البيانات: 


يتعيّن على الحكومات أن تعمل Ía‏ بمنع التهرب الضريبيء والذي يؤدي إلى تناقص ملحوظ 
في عائداتها. ففي عام 17١1م؛‏ نجحت إدارة العائدات الداخلية (185) في إجهاض محاولات 
من مجهولين» كانت تستهدف خداع الحكومة الفيدرالية في مبلغ ١‏ ,! مليار دولار من مبالغ 
الضرائب. ومع ذلكء وفي نفس العام. خسرت مصلحة الضرائب الأمريكية مبلغ 8,0 مليار دولار 
على مطالبات 35M Cs d lobo] eS‏ تحت بند التهرّب الضريبي. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yyy‏ 


الفصل الثالث 


كما تخسر الولايات الأمريكية أيضًا الكثير من الأموال عندما ييستخدم المحتالون أرقام الضمان 
الاجتماعي المسروقةء ونماذج ۷-2 وغيرها من المعلومات الشخصية لتقديم مطالبات مزيفة. وقد 
زاد هذا النوع من الجرائم في السنوات الأخيرة معدل يُنذر بالخطر. يقول بيتر فرانشوتء المراقب 
المالي بولاية ماريلاند: «لقد سمع كل الأمريكيين تقريبًا عن سرقة الهوية؛ لكن القليل منهم فقط 
كان على دراية بهذه الزيادة الهائلة في تزوير العائدات الضريبية. إن هذه المشكلة المزعجة تؤثر 
على كلّ دول العالم. وهذا ما يُعرّف - حرفيًا - بالسطو الممنهج على أموال دافعي الضرائب». 

في ولاية ماريلاند؛ كان الأشخاص المتهمون بتزييف مطالبات الاسترداد أعضاءً في فريق الكشف 
عن العائد المشكوك فيه (01101). ومثل نظرائهم في العديد من الولايات الأخرى» يستخدم 
هؤلاء الخبراء البرمجيات؛ لتحديد العوائد المشبوهة. ثم يقومون بعد ذلك بالتحقيق في العائدات 
لتسليط الضوء بدقة على الاحتيالي منها. 
التحدى: 


في الماضي؛ كانت ولاية ماريلاند تستخدم مقاييسَ لفحص الإقرارات الضريبية واحدًا تلو الآخر. 
فإذا انَّسَم العائدٌ بصفات مُحدّدة - مثل: نسبة معينة من الأجور المكتسبة إلى الأجور المحتجزة 
- قامت البرمجيات بتعليق ذلك العائد لحين التحقيق فيه. ثم قام أعضاء 0851 بالنظر في 
ÍS‏ العائدات المعلقة؛ وذلك عن طريق مقارنة الأجر والمعلومات المحجوبة بالأرقام المقدّمة من 
موذج 1187-2 الذي تمّ استلامه من قبل صاحب العمل. كانت العملية كثيفة العمالة وغير فعالة. 
ومن أصل ما یقرب من ۲ ,۸ مليون عائد ضريبي كانت تحصل عليه ميريلاند JS‏ عام» قام أعضاء 
فريق 01:51 بتعليق حوالي ٠٠٠٠١‏ منها. ولكن تبَيّن أن معظم تلك العائدات كانت عائدات 
مشروعة. يقول آندي شاوفيلء مدير مكتب تقديرات الإيرادات لمراقبة حسابات ولاية ماريلائد: 
«لقد تبَيّن لنا أن “٠١‏ فقط من الممؤلين كانوا مخادعين». 

في سنة نموذجية؛ أنقذت تلك العملية ولاية ماريلاند من سداد ما بين ه إلى ٠١‏ ملايين 
دولار كمطالبات استرداد مزيفة. وعلى الرغم من نجاح ذلك؛ فإنها تُعَنُ مجرد Jo‏ متواضع؛ مع 
الأخذ بعين الاعتبار الموارد المرتبطة بالعملية وإزعاج دافعي الضرائب المخلصين الذين تمّ تحديد 
عوائدهم للتحقيق. يقول شاوفيل: «كان التفكير في أننا كنا نعلق ما بين 1٠٠٠١‏ و 0 عملية 
استرداد للضرائب أمرًا صعبًا. لقد أردنا الحصول على هذه المبالغ المستردّة لدافعي الضرائب 
بشكلٍ أسرع؛ إذ يعتمد الكثيرٌ من الناس على هذا امال كجزءٍ من دخلهم». 


rrr‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


الحل: 

احتاجت ماريلاند إلى عملية أكثر فعالية. كما احتاجت إلى إستراتيجيات جديدة لاستمرار 
السيطرة على اللحتالين. يقول شاوفيل: «كانت جميع الولايات» وكذلك مصلحة الضرائب الداخلية 
5 يستخدمون جميعًا نفس المقاييس التي كنا نستخدمهاء ولا أعتقد أنه كان من الصعب على 
المجرمين معرفة الإجراءات الاحترازية التي نتبعها». ولحُسن الحظ؛ حصلت ماريلاند مؤخرًا على 
سلاح جديد قوق ضد التهرّب الضريبي. في عام ١٠٠٠1م:‏ عمل مراقب الخزينة في ماريلاند مع 
شركة دماترة2 04 16220212 بولاية أوهايىو لتنفيذ مستودع بيانات aias‏ لدعم مجموعة 
متنوعة من مبادرات الامتثال. 

وبينما كان المسؤولون يناقشون المبادرات التي يجب إطلاقها؛ طفت فكرةٌ واحدةٌ على السطح. 
تقول شارون بونارديء نائبة مراقب ولاية ماريلاند: «لقد قرّرنا أننا يجب أن نعطي الأولوية 
لجهودنا الرامية إلى تعقب الاحتيال في استرداد الأموال». لذا بدأت الولاية العمل مع تيراداتا ومع 
شركة ءءارلة 4 45۸ في بوتوماك بولاية ماريلاند؛ لتطوير عملية أفضل لعزل الإقرارات الضريبية 
الاحتيالıة‏ )2013 .(Temple West,‏ 

يقول شاوفيل: «كانت الخطوة الأولى؛ هي تحليل بياناتنا وتعلّم ما يمكن تعلّمه عن الاحتيال». 
ومن بين الاكتشافات الأخرى؛ أظهر التحليلٌ أنه عندما يتم تعليق عائدات متعددة - حتى لأسباب 
مختلفة تمامًا - فإنها غالبًا ما تكون لها سمات مشتركة. قامت الولاية ببناء قاعدة بيانات للسمات 
التي تميّز الخصائص الاحتيالية للعائدات, وكذلك للسمات التي يتميّز بها الشرفاء. يقول شاوفيل: 
«لقد عملنا مع 4518 لوضع هذه المعلومات معًا وتطوير الانحدارات الخطية» وبدلًا من النظر 
إلى المقاييس ال منفردة بذاتها؛ شرعنا في تطبيق فكرة الجمع بين العديد من هذه المقاييس معّا». 
وكانت النتيجة صورةً أكثر دقة من حيث درجات الاختلاف للعائد الاحتيالي المعتاد. 

وبدلًا من تعاقب العائدات الضعيفة واحدًا تلو الآخر؛ يُحدّد النظام الجديد مجموعات 
العائدات التي تبدو مشبوهةً لأسباب مماثلة. تجعل هذه الإستراتيجية عملية التحقيقات تسيرٌ 
بشكل أسرع. ويُحدّد نظام التحليلات أيضًا درجةً لكلّ عائد؛ وذلك بناءً على مدى احتمالية 
كونه احتياليًا. ثم ينتج بعد ذلك قائمة ذات أولوية لتوجيه سَيْر عمل '08107. يقول شاوفيل: 
«نحن نعمل أولًا على العائدات التي من الأرجح ألا تكون احتيالية؛ ولذا يمكننا إخراجها من قائمة 
الانتظار». ثم تعود العائدات الأكثر شبهةً للمراجعة مرةً أخرى. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري v‏ 


الفصل الثالث 


النتائج: 

يقول بوناردي: «بفضل نماذج التحليلات هذه؛ يمكننا تقليلٌ القيّم الموجبة الخاطئةء حتى لا 
نثقل على كاهل دافعي الضرائب الذين قدَّموا إقراراتهم الضريبية بدقة إلى الولاية». وبمجرد أن 
يزيل المحققون عائداتهم من قائمة الانتظار؛ يصبح بإمكان دافعي الضرائب استرداد مطالباتهم 
التي clab‏ منهم بالخطأ. 

وبفضل التقنية الجديدة؛ تتوقع :018101 تعليق ما يتراوح من 0٠٠٠١‏ إلى ٠٠٠٠١‏ فقط من 
العائدات الضريبية» مقارنةً ب ٠٠٠٠٠١‏ في السنوات الماضية. يقول شاوفيل: «من بين كل هؤلاء 
الذين عملنا معهم حتى الآن؛ نحصل على نسبة دقة تصل إلى 10* تقريبًا». وَيُعَدُ ذلك تحسّنًا 
ylis 5l‏ معدل النجاح التاريخي البالغ :٠١‏ فقط. ويقول فرانشوت» ال مراقب ال مالي مماريلاند: 
«مجدد أن يتم تحديدٌ العائدات التي قد تكون احتياليةء هكن لفريق الخراء ا ممتحنين أن 
يراجعها بعنايةء في وقت واحد؛ لإزالة تلك العائدات التي تثبت عدم شرعيتها. وبذلك تتحسّن 
العملية بِرُمّتها بشكلٍ أفضل طوال الوقت». 

ds‏ أواخر مارس من نفس العام؛ ساعدت التحليلات المتقدّمة فريق 01527 على استرداد 
حوالي ٠١‏ مليون دولار في موسم الإيداع الحالي. يقول شاوفيل: «في ظل النظام القديم» كان هذا 
الرقم يبلغ حوالي " ملايين دولار في هذه المرحلة». ولا يقتصر دور التقنية الجديدة فقط على 
تيسير عمل ۸51 بشكل أسرع وأكثر كفاءة؛ ولكنها أيضًا تساعد الفريق على التعامل مع عبء 
العمل الأكثر تعقيدًا. وعندما زاد المتهربون من الضرائب من جهودهم, لجأ فريق 08277 إلى 
نَشْر إستراتيجيات جديدة ضدهم. فعلى سبيل المثالء في عام ١10‏ "م تلقَّى الفريق حوالي ٠٠٠٠١‏ 
إخطار من دافعي الضرائب الذين تمت سرقة هوياتهم. يقول شاوفيل: «إذَا لدينا سَيْر عمل 
جديد: وهو البحث عن أرقام الضمان الاجتماعي الخاصة بهم ومحاولة العثور على أيّ حوادث 
تزوير قد تكون أرتكبّت معهم., ويَُذ هذا مستوّى جديدًا من الجهود التي تُكّملها هذه المجموعة 
الآن بدون موارد إضافية». 

وللمحافظة على مُخططات ضريبية أكثر تطوراً لا يقوم المحققون الآن بفحص استمارات 1177-2 
الحالية فحسب؛ بل يقومون أيضًا بمقارنتها باستمارات نفس الممولين من السنوات السابقة؛ بحنًا 
عن التناقضات. ويضيف شاوفيل: «أصبحت التحقيقات أكثر تعقيدًا واستغراقًا لوقت أطولء وإذا 
لم تتم مراجعة تلك الإجراءات بعناية؛ فستلاحقنا بلا شك بعض المشكلات الحقيقية». 


vye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


أسئلة على المقالة الافتتاحية: 

-١‏ لماذا من المهمٌ مصلحة الضرائب الأمريكية ولحكومات الولايات الأمريكية استخدام أدوات 
مستودعات البيانات» وأدوات ذكاء الأعمال في إدارة الدخل القومي؟ 

-١‏ ما هي التحَدَّيات التي تواجه ولاية ماريلاند فيما يتعلّق بالتهرب الضريبي؟ 

gill Jodl ga ls -Y‏ اعتمدوه؟ وهل توافق على طريقتهم؟ ولماذا؟ 

ع- ما هي النتائج التي حصلوا عليها؟ وهل نجح الاستثمار في (ذكاء الأعمال) ومستودعات البيانات؟ 

-٥‏ ما هي المشكلات والتحَدّيات الأخرى التي تعتقد أن تواجهها الحكومات الفيدرالية وحكومات 
الولايات» والتي يمكن أن تستفيد من ذكاء الأعمال ومستودعات البيانات؟ 


ماذا يمكننا أن نتعلّم من هذه المقالة الافتتاحية القصيرة؟ 

وصح اللقالة الافتتاحية قيمة ذكاء الأعمال» وأنظمة دعم القرا. ومستودعات البيانات في 
إدارة الإيرادات الحكومية. مع تنفيذ مستودع البيانات الخاصة بهم تمكّنت ولاية ميريلاند 
من الاستفادة من أصول البيانات الخاصة بها؛ لاتخاذ قرارات أكثر دقة وفي الوقت المناسب 
حول تحديد الإقرارات الضريبية الاحتيالية. وبتنفيذهم لفكرة مستودع البيانات» تمكنّت ولاية 
ماريلاند من الاستفادة من أصول البيانات الخاصة بها بشأن اتخاذ قرارات أكثر دقة وفي الوقت 
امناسب؛ وذلك فيما يتعلق بتحديد الإقرارات الضريبية الاحتيالية. وقد أتاح دمج ومعالجة 
مجموعة واسعة من مصادر البيانات داخل مستودع بيانات موحد لولاية ماريلاندء تحديد 
إشارات/ قواعد/ سمات الاحتيال الضريبي من الحقائق التاريخية بصورة أو توماتيكية بدلا 
من الاعتماد فقط على الطرق التقليدية؛ إذ تمّ تطبيق قواعد التصفية القائمة على الحدس. 
وباستخدام مستودعات البيانات وذكاء الأعمالء تمكّتّت ولاية ماريلاند من تقليل مُعدَّل القيم 
الموجبة الخطأ بشكل ملحوظ (وبذلك تمّ تخفيفُ العبء الضريبي على الممولين) CS US‏ 
من تحسين معدل دقة التنبؤ من +٠١‏ إلى 70 (أي أكثر من ستة أضعاف التحسن في دقة 
تحديد الإقرارات الضريبية الاحتيالية). وَيُعَدٌ الدرس الرئيس هنا هو أن مستودع البيانات 
Sio Xil eal‏ صحيح مع أدوات وتقنيات ذكاء الأعمال يمكن أن يؤدي إلى تحشّن 
معنوي (سواء على مستوى الدقة أو التوقيت)؛ مما يؤدي إلى فوائد (مالية أو غير مالية) لأيّ 
منظمة: بما في ذلك حكومات الولايات مثل ماريلاند. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ro‏ 


الفصل الثالث 


۲-۳ ذكاء الأعمال ومستودعات البيانات: 

لقد كان ذكاءٌ الأعمال» كمصطلح لوَسْف عملية اتخاذ القرار الإداري القائم على 
الحقائق/ الدليلء موجودًا منذ أكثر من ٠١‏ عامًاء. ومع ظهور تحليلات الأعمال ككلمة رنّانة 
جديدة لوصف نفس الظاهرة الإدارية إلى حَدَّ كبير؛ فقد انخفضت شعبية مصطلح ذكاء الأعمال. 
وعلى عكس كونه مصطلحاً شاملا يُستَخدَّم ذكاء الأعمال في الوقت الحاضر لوصف ال مراحل 
المبكرة لتحليلات الأعمال (أيْ: التحليلات الوصفية). 

يُوَضّح الشكل "13 (والذي تم عَرْضِ وشَرْح نسخة مُبسّطة منه في الفصل الأول لوصف 
تصنيف تحليلات الأعمال) العلاقة بين ذكاء الأعمال وتحليلات الأعمال من منظور مفاهيمي. وكما 
هو مُوضّح هنا؛ فإن ذكاء الأعمال هو جزءٌ تحليليٌ Lies‏ من سلسلة تحليلات الأعمال؛ إذ يؤدي 
نضجها إلى تحليلات متقدمة - وهي Qa e‏ من التحليلات التنبؤية والإلزامية. 

تُعَدُ التحليلات الوصفية (أيّْ: ذكاء الأعمال) مستوّى مبدئيًا للدخول في تصنيف تحليل 
الأعمال. وغالبًا ما يُطلّق عليها اسم إعداد تقارير النشاط التجاري؛ بسبب حقيقة أن معظم 
أنشطة التحليلات في هذا المستوى تتعامل مع إنشاء تقارير لتلخيص الأنشطة التجارية للإجابة 
عن أسئلة, مثل: «ماذا حدث؟» و«ما الذي يحدث؟». تشمل هذه الحزمة من التقارير لقطات 
ثابتة لمعاملات الأعمال التي تمّ تسليمها إلى العاملين في مجال المعرفة (أيْ: صناع القرار)؛ وذلك 
Liss‏ لجدول زمني ثابت (يوميء أو أسبوعي أو ربع سنوي)؛ وكذلك تقارير مُخصّصة تمكُن 
صانع القرار من إنشاء تقريره الخاص (باستخدام واجهة مُستخدم رسومية حدسية مُسطحة) 
لمعالجة حالة قرار مُحدَّدة أو فريدة من نوعها؛ وأيضًا وجهات نظر ديناميكية لمؤشرات أداء 
الأعمال الرئيسة (والتي غالبًا ما يتم التقاطها وعرضها في نظام إدارة أداء الأعمال) يتم تسليمها 
إلى المديرين والموظفين التنفيذيين في شكلٍ سهل الاستيعاب (مثل: واجهات رسومية تظهر كلوحة 
معلومات) بطريقة مستمرة. 


Sources: Teradata case study. (2016). Targeting tax fraud with advanced analytics. http://assets.teradata. 
com/resourceCenter/downloads/CaseStudies/EB7183 GT16 CASE STUDY Teradata V.PDF (accessed 
June 2016); Temple-West, P. (2013, November 7). Tax refund ID theft is growing "epidemic": U.S. IRS 
watchdog. Reuters. — http://www.reuters.com/article/us-usa-tax-refund-idUSBRE9A61HB20131107 
(accessed July 2016). 


v‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


تحليلات الأعمال 











شكل :1-١‏ العلاقة بين تحليلات الأعمالء وذكاء الأعمالء وتخزين البيانات 
بشكل عام؛ وكما هو iud‏ في الشكل (-1). تعتمد أنظمة ذكاء الأعمال على مستودع البيانات 
كمضدر للمعلومات؛ من أجل إنشاء ودَعْم القرارات الإدارية. إذ يتم التقاط العديد من البيانات 
التنظيمية والخارجية وتحويلها وتخزينها في مستودع بيانات لدعم القرارات الدقيقة في الوقت 
ا مناسب من خلال نظرة عميقة للأعمال. ويهدف هذا الفصل إلى تغطية المفاهيم والطرق 
والأدوات المتعَلّقة بمستودعات البيانات وإدارة أداء الأعمال. 


ما هو مستودع البيانات؟ 

بعبارة بسيطة؛ يُعَذّ مستودع البيانات (2117) تجمعاً من البيانات التي يتم إنتاجها لدعم 
gió ilas‏ القرار. وهو أيضًا منطقةٌ غنيةٌ بالبيانات الحالية والتاريخية والتي من المحتمل أن 
تكون ذات أهمية كبيرة في المسقبل بالنسبة للمديرين في جميع أقسام ا منظمة. وعادةً ما تكون 
البيانات مهيكلةً؛ بحيث تظهر في صيغة جاهزة لأنشطة ا معالجة التحليلية (أي: المعالجة التحليلية 
عبر الإنترنت ui [OLAP]‏ في البيانات» الاستعلام, إعداد التقاريرء وغيرها من تطبيقات دعم 
القرار). إن مستودع البيانات؛ هو عبارة عن مجموعة موضوعية ومتكاملة وموجهة زمنيًا وغير 
متطايرة من البيانات لدعم العملية الإدارية المتعلقة باتخاذ القرارات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vvv‏ 








الفصل الثالث 


منظور تاريخي لمستودعات البيانات: 

على الرغم هن أ مستودعات البيانات هو مصطلح جديد نسبيًا في تقنية المعلومات s(IT)‏ 
فإنه من الممكن تتبّع أصوله التاريخية» وحتى من قبل التوشّع في استخدام أجيزة الحاسب. ففي 
أوائل القرن العشرين؛ كان الناس يستخدمون البيانات (بالطرق اليدوية) لصياغة الاتجاهات التي 
تساعد مستخدمي الأعمال في اتخاذ قرارات مستنيرة وهو أكثر الأغراض السائدة في مستودعات 
البيانات. وترجع - تاريخيًا - الدوافع التي أدّت إلى تطوير تقنيات مستودعات البيانات إلى حقبة 
السبعينيات: عندما هيمنت المركزية على عالم الحوسبة. وقد امتلكت تطبيقات معالجة البيانات 
التجارية الحقيقية - والتي يتم تشغيلها على أجهزة الحاسب المركزية للشركات - هياكل ملفات 
معقدة باستخدام الجيل المبكر من قواعد بيانات (وليست قواعد البيانات الجدولية المستخدَمة 
في معظم التطبيقات في الوقت الحالي) والتي يتم إيداع البيانات بها. وعلى الرغم من أن هذه 
التطبيقات قَدَّمَتَ أداءَ جيدًا في وظائف معالجة البيانات للمعاملات الروتينية؛ فإنَّ البيانات التي تم 
إنتاجها من أداء هذه الوظائف (مثل: المعلومات المتعلقة بالعملاء» وا منتجات التي يطلبونهاء والأموال 
التي ينفقونها) قد تمّ دفنها بعيدًا في أعماق الملفات وقواعد البيانات. وعندما ظهرت الحاجة إلى 
معلومات مُجمّعة مثل: اتجاهات المبيعات بحسب المنطقة ونوع المنتج» كان ينبغي أن تطلب رسمياً 
من قسم معالجة البيانات؛ إذ تم وَضْعَ ذلك الطلب في قائمة انتظار تضم مئات من طلبات التقارير 
الأخرى )2009 des .(Hammergren & Simon,‏ الرغم من ظهور الحاجة إلى المعلومات والبيانات 
امُستخدّمة لتوليد تلك المعلومات؛ فإنَّ تقنية قواعد البيانات لم تكن موجودةً لتحقيق ذلك. tsi‏ 
الشکل ۲-۲ جدولًا زمنيًا يظهر فيه بعض الأحداث المهمة التي أذَّت إلى تطوير مستودعات البيانات. 


SEEDS‏ . التخزين المركزي للبيانات 2 02 أجهزة الكمبيوتر الرئيسية 














" 
تحليلات وسائل التواصل الإجتماعى اي ولادة تخزين الييائات VO Led Ha dual t‏ 
vo iig pagina elizy Inmon y ula uai colas‏ إعداد التقارير الروتينية ‏ ”ا 
Kimball > Hadoop. MapReduce, NoEQL‏ ومصوعة عرلا رع ی 27 هياكل قاعدة البيانات الأولية 7 
EDW Z In-mamory. in-databaca:‏ 0 تيرا داتا المتحدة Y‏ 
جه و2010 —» — A — 1870s — 3 — 1980s — 3» 1990s — >— 2000s‏ 
بيانات الويب المتنامية بشكل كبير > اجهزة الكمبيوتر الشخصية#الصغيرة (PCS)‏ 7 
تدعيم صناعة 1218/1131 * تطبيقات الأعمال (PCs)‏ 7 
ظهور أجهزء مستودع البيانات 7 v DBMS gj‏ 
ازدياد شعبية ذكاء الاعمال BMS r‏ العلائقي * 
الثنقيب فى البيانات والنمذجة التنيؤية ⁄ تشالت عد جه 
البرامج المجائية n‏ تأسيس مستودع بيانات الأعمال 
5 والحوسبة السحابية * 


شكل 8-: قائمة الأحداث التي أذَّت إلى تطوير تخزين البيانات 


YYA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 

















التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


في أواخر القرن الماضي؛ ظهرت شركات تجارية تعمل على تطوي ر الأجهزة والإرمجيات» وقد 
شهد ظهور تلك الشركات بعض الحلول لهذه المشكلة. وقد انبثق بین gale‏ ۱۹۷۲ و۱۹۷۹ م 
مفهوم شركة جديدة - تيراداتا - من الأبحاث في معهد كاليفورنيا للتقنية (“021]6). مستندةً 
على مناقشات أجريّت مع مجموعة التقنية المتقدّمة في sög Citibank‏ عمل المؤسسون على 
تصميم نظام لإدارة قواعد البيانات للمعالجة المتوازية مع المعالجات الدقيقة المتعددة, والتي 
تستهدف بشكلٍ خاصٌ دعم القرار. وفي ١١‏ يوليو 1915م: تمّ تأسيسٌُ Gaw lol‏ وقد بدأت في 
جراج في -Brentwood‏ بولاية كاليفورنيا. وقد تمّ اختيار اسم تيراداتا لترمز إلى القدرة على إدارة 
تيرابايت (تريليونات من الحروف) من البيانات. 

كانت الثمانينيات هي عقد الحواسيب الشخصية والحواسيب الصغيرة. وقبل أن يعرفها 
أحدٌء لم تَعْد تطبيقات الحاسب الحقيقية موجودةً على أجهزة الحاسب المركزية فقط؛ بل كانت 
موجودةً في كلّ مكانٍ يمكن أن تتواجد فيه أي منظمة؛ مما تسبب في ظهور مُشكلة خطيرة تُسمّى 
جزر البيانات. وقد أدَى حل هذه المشكلة إلى نشأة نوع جديد من البرمجيات. يُسمّى نظام إدارة 
قاعدة البيانات الموزّعة: والذي من شأنه سخب البيانات المطلوبة بطريقة سحرية من قواعد 
البيانات من جميع أقسام المنظمة؛ وإعادة جميع تلك البيانات مرةً أخرى إلى نفس ال مكان» ثم 
دمجهاء وفرزهاء وعمل كل ما يلزم للإجابة عن سؤال المستخدم. وعلى الرغم من كون المفهوم 
جيدًا وكذلك كون النتائج المبكرة من الأبحاث واعدة؛ فإنها كانت نتائج عادية وبسيطة؛ فهي م 
تعمل بكفاءة على أرض الواقع» وبالتالي ظلت مشكلة جزر البيانات قائمة. 

s‏ الوقت نفسه؛ بدأت تيراداتا في شَحْذْ كلّ اهتماماتها تجاه المنتجات التجارية المتعلقة بحل 
هذه المشكلة. وقد حصل بنك ويلز فارجو على أول نظام اختبار تيراداتا في عام 19/7م: وهو أحد 
أنظمة إدارة قواعد البيانات العلائقية (1108315) وهو نظام مواز لدعم القرار ads‏ الأول من 
نوعه في العام. وبحلول عام ٤۱۹۸م»‏ أصدرت تيراداتا نسخة من منتجهاء وفي عام 1147م: أطلقت 
مجلة 101161116 على تيراداتا لقب «منتج العام». وقد قام منتج تيراداتا - والذي لا يزال قانما حتى 
اليوم - ببناء أول جهاز لمستودعات البيانات» وهو عبارة عن مجموعة من الأجهزة والبرمجيات 
لتلبية احتياجات مستودعات البيانات للكثير من المتعاملين في هذا الحقل. وبدأت كذلك العديدٌ 
من الشركات الأخرى في صياغة إستراتيجياتها. 

كما وقعت عدة أحداث أخرى خلال الثمانينيات من القرن الماضي؛ مما أكسبها لقب حقبة 
الابتكار في مستودعات البيانات. فعلى سبيل المثال: أسّس رالف كيمبال أنظمة 816 264 في 
عام ١۱۹۸م.‏ بدأت آنظمة )ا8 ۸۵4 في الظهور كشركة برمجيات رائدة من خلال مناقشة كيفية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vys‏ 


الفصل الثالث 


تحسين الوصول إلى البيانات؛ ففي عام /198م؛ قدَّم كلّ من باري ديفلين وبول مورفي من IBM‏ 
إيرلندا مصطلح مستودع بيانات الأعمال كمكوّن أساسي لنظم المعلومات التجارية. وفي تسعينيات 
القرن العشرين؛ طفت على السطح طريقة جديدة لحل مشكلة جزر البيانات. وإذا كانت طريقة 
الثمانينيات قد فشلت في الحصول على البيانات والوصول إليها مباشرةً من ال ملفات وقواعد 
البيانات؛ فقد انطوت فلس فة التسعينيات على العودة إلى نهج السبعينيات؛ إذ تمّ تَسْحُ البيانات 
من تلك الأماكن إلى مكان آخرء ولكن يتم فل ذلك بشكلٍ أكثر دقة. ومن هنا وُلِدَتَ مستودعات 
البيانات. في عام ۳م کتب bL pogras clo LS Bill Inmon‏ يُصنّف الكثيرٌ من الناس 
23 آكأب لمستودعات البيانات. وظهرت منشورات إضافية - بما في ذلك كتاب «مجموعة 
أدوات مستودع البيانات» لصاحبه رالف كيمبال 1197م - والتي ناقشت تقنيات تصميم الأبعاد 
ذات الأغراض العامة لتحسين بنية البيانات لأنظمة دعم القرار المرتكزة على الاستعلام. 

ومع بدايات الألفينات» وفي عام مستودعات البيانات» استمرّت شعبية البيانات في النمو. 
وبدأ اندماج مجتمع المورّدين مع الخيارات. وفي عام 7١٠٠م؛‏ استحوذت شركة مايكروسوفت 
(81160501) على :(5:00012116؛ إذ قفزت إلى سوق مستودعات البيانات. وفي feY* *V ele‏ 
قامت شركة أوراكل بشراء 11770611013 واستحوذت 542 على 5اءءز0 8115111655: واندمجت 
e! a Cognos ga IBM‏ قادة أكبر g‏ حلول نظم المعلومات في العام قادة مستودعات 
البيانات في التسعينيات. وخلال هذه الفترة؛ ظهرت ابتكارات أخرىء بما في ذلك أجهزة مستودعات 
البيانات من مُورّدِيها مثل 21616228 (التي استحوذت JI) GreenPlums (IBM ade‏ دخلت 
في مظلة go Caza 33l 471) DATAllegros (EMC‏ مایکروسوفت 8542s ((Microsoft)‏ 
إدارة الأداء التي سهّلت عملية مراقبة الأداء بشكل فوري. وقد وفرت هذه الحلول ال مبتكرة 
وفورات في التكاليف؛ لأنها كانت متوافقة في تكوينها مع الحلول القدهة ممستودع البيانات. 

منذ عام ۲٠٠١‏ كانت الضجة الكبيرة هي البيانات الضخمة. يعتقد الكثيرون أن البيانات 
الضخمة ستؤثر في مستودعات البيانات. وحيال ذلك إما أنهم سيجدون طريقة للتعايش (والتي يبدو 
أنها الحالة الأكثر ترجيحًا. على الأقل لعدة سنوات) أو أن البيانات الضخمة (والتقنيات التي تصاحب 
وجودها) ستجعل التخزين التقليدي للبيانات أسلوبًا قدي ومُهِمَلًا. وتتضمّن التقنيات التي جاءت 
مع البيانات الضخمة كلا lgj «Hives NoSQLs MapReduces Hadoop (y‏ أننا سنكون يصدد 
ظهور مصطلح جديد تتم صياغته في عام البيانات؛ ليجمع بين ظهور مصطلح جديد تمَّ صياغته في عام 
البيانات الذي يجمع بين احتياجات وقدرات التخزين التقليدي للبيانات وظاهرة البيانات الضخمة. 


v.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


خصائص مستودعات البيانات: 
يُكَن أحد الطرق الشائعة لإدخال مستودعات البيانات؛ هو الرجوغ إلى الخصائص الأساسية 

لتلك البيانات والتي يُعَدٌ من أهمّها (انظر: 2005 X(Inmon,‏ 

- التوجّه بالموضوع: يتم تنظيمُ البيانات حسب تفاصيل الموضوع: مثل: المبيعات» أو المنتجات» 
أو العملاءء والتي تحتوي فقط على المعلومات المتعلّقة بدعم القرار. ولا تكن توجيه الموضوع 
المستخدمين من تحديد كيفية أداء أعمالهم فحسب؛ بل أيمًا ممكّنهم من معرفة سبب أدائهم 
لتلك المهام. ويختلف مستودع البيانات عن قاعدة البيانات التشغيلية؛ بحيث يكون ممعظم 
قواعد البيانات التشغيلية توجّه بالمنتج» ويتمُ ضبطها للتعامل مع المعاملات التي تقوم بتحديث 
قاعدة البيانات. يُوفُر اتجاه الموضوع نظرةً أكثر شمولية للمنظمة. 

- التكامل: يرتبط التكامل ارتباطًا وثيقًا بتوجيه الموضوع. كما يجب على مستودعات البيانات 
أن توفر البيانات القادمة من مصادر مختلفة في شكلٍ متسق. وللقيام بذلك؛ فيجب على 
مستخدمي تلك المستودعات التعاملٌ مع تسمية التعارضات والتناقضات بين وحدات القياس. 
ومن المفترض أن يكون مستودع البيانات متكاملًا تمامًاء 

- التغيّر مع الوقت (سلسلة زمنية): يحتفظ المستودع بالبيانات التاريخية. وليس بالضرورة أن 
توفر البيانات الحالة الحالية (باستثناء الأنظمة الفورية). فهي تكتشف الاتجاهات والانحرافات 
والعلاقات طويلة الأجل للتنبؤ والمقارنات؛ مما يؤدي إلى اتخاذ قرار. ويكون لكلّ مستودع 
بيانات جودةٌ زمنية. iig‏ الوقت هو البُعْد الأكثر أهميةً وربما الأوحد الذي يجب أن يتم 
دعمه من قبل جميع مستودعات البيانات. كما تحتوي البيانات المُجهّزة للتحليل والقادمة 
من مصادر متعددة على نقاط زمنية مختلفة (كالمشاهدات اليومية: والأسبوعية» والشهرية). 

- عدم التطاير (الثبات): فبُعْد مستودعات البيانات في المستودع, لا تكن للمستخدمين تغيير أو 
تحديث تلك البيانات؛ إذ يتم تجاهل البيانات القديمة» ويتم تسجيل التغييرات كبيانات جديدة. 

هذه الخصائص السالفة الذكر تمن مستودعات البيانات ليتع ضبطها بشكل حَصْري تقريبًا 

ممهمة الوصول إلى البيانات. كما تُوجَّد خصائص أخرى إضافية للبيانات والتي تتضمّن ما يلي: 

- الارنكاز على شبكة الإنترنت: يتم kunad‏ مستودعات البيانات عادةً لتوفير بيئة حوسبة فعّالة 
للتطبيقات المستندة إلى الويب. 

- العلائقية/ متعددة الأبعاد: يستخدم مستودعٌ البيانات إِمّا بنيةَ علائقيةً أو بنيةً متعددة الأبعاد. 
ويمكن العثور على دراسة استقصائية حديثة حول الهياكل المتعددة الأبعاد في روميرو وأبيلو .)7٠١09(‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري v"‏ 


الفصل الثالث 


- خدمة العملاء: يستخدمٌ مستودع البيانات فنَّ خدمة العملاء؛ لتوفير وصول سهل للمستخدمين النهائيين. 
- الفورية: توفّر مستودعات البيانات الأحدث إمكانيات الوصول إلى البيانات وتحليلها بشكلٍ 
فوري أو نشط (انظر: 2004 j .(Basu, 2003; Bonde & Kuckuk,‏ 
- الاشتمال على البيانات الوصفية: يحتوي مستودع البيانات على بيانات وصفية (بيانات عن 
البيانات) حول كيفية تنظيم البيانات وكيفية استخدامها بفعالية. 
في الوقت الذي يُعَدُ فيه مستودعٌ البيانات مكاناً Gal‏ للبيانات» تُعَدُ مستودعات البيانات 
العملية برمتها حرفيًا (انظر: 2002 (Watson.‏ ]5 تُعَذُ مستودعات البيانات نظامًا ينتج عنه 
تطبيقات توفر قدرةً على دعم القرا. كما يسمح بإمكانية الوصول إلى معلومات الأعمالء وأيضًا 
رؤية لتلك الأعمال. والأنواع الرئيسية الثلاثة لمخازن البيانات؛ هي: أسواق البيانات (22/15): 
ومخازن البيانات التشغيلية (ODS)‏ ومستودعات بيانات المؤسسة (812117). وفيما يلي مناقشة 
لهذه الأنواع الثلاثة من امستودعات» ثم سنناقش أيصًا بعد ذلك البيانات الوصفية. 


:(DMs) cU! أسواق‎ 


في الوقت الذي يضم فيه مستودع البيانات قواعد البيانات الكبيرة عبر المؤسسة بأكملهاء ole‏ 
ما يكون سوق البيانات (221) أصغر حجمًا ويرك أكثر على موضوع أو قسم معين. DM Òl‏ هو 
عبارة عن مجموعة فرعية من مستودع البيانات» تتكوّن عادةً من منطقة موضوع واحد فقط 
(كالتسويقء أو العمليات). وقد تكون 721 تابعةً أو مستقلةً. يكون سوق البيانات التابع عبارة 
عن مجموعة فرعية يتم إنشاؤها مباشرةً من مستودع البيانات. كما أن لديها مزايا استخدام نموذج 
بيانات متسق وتوفير بيانات جيدة. وتقوم أسواق البيانات التابعة بِدَعْمِ مفهوم نموذج بيانات 
واحد على مستوى المؤسسة بأكملها؛ ولكن يجب أولا إنشاءٌ مستودع البيانات. يضمن 22/1 التابع 
للمستخدم النهائي أن يشاهد نفس الإصدار من البيانات التي يشاهدها كل المستخدمين الآخرين 
مستودع البيانات. تتسبّب التكلفة العالية لمستودعات البيانات في الحَدَّ من استخدامها للشركات 
الكبيرة. فتستخدم العديدٌ من الشركات بدلا من ذلك إصدارًا منخفض التكلفة ومصغرًا لمستودع 
البيانات يعرف على أنه سوق البيانات المستقل. Sgu AB‏ البيانات المستقل مستودعًا صغي 
مُصمَّمًا لوحدة أعمال إستراتيجية؛ لكن لا يكون مستودع بيانات المشروع (5810117) مصدرًا له. 


مخازن البيانات التشغيلية :(ODS)‏ 


يُوَفّر مخزن البيانات التشغيلي (025) نموذجًا حديثًا إلى حَدَّ ما لملف معلومات العميل. 
وغالبًا ما يُستخدّم هذا النوع من قواعد البيانات كمنطقة مؤقتة لمستودعات البيانات. وبخلاف 


rrr‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


المحتويات الثابتة مستودع البيانات» يتم تحديث محتويات (0525) طوال فترة العمليات 
التجارية. وتُستخدّم (ODS)‏ $ اتخاذ القرارات القصيرة الأجل التي تشمل التطبيقات ذات اهام 
الحسّاسة بدلا من اتخاذ القرارات المتوسطة والطويلة الأجل ا مرتبطة (ODS) 4423 (EDW).5‏ 
الذاكرة القصيرة المدى في أنها تخرّن المعلومات الحديثة فقط. وف المقابل؛ يشبه مستودع البيانات 
الذاكرة الطويلة المدى؛ لأنه يُخِرَّن معلومات دائمة. يقوم 055 بِدَمّْج البيانات القادمة من أنظمة 
مصادر مُتعدّدة ويوفر رؤية متكاملة تقريبًا للبيانات المتغيرة والحالية. وتتطابق عمليات تبادل 
ونقل وتنزیل (11) - والتي ستتم مناقشتها لاحقًا في هذا الفصل - الخاصة ب )05S(‏ مع تلك 
العمليات المتعلقة مستودع البيانات. وأخیر يتم إنشاء سوق التشغيل (انظر: 2001 :8مطدم1) 
عند الحاجة إلى تحليل البيانات التشغيلية المتعددة الأبعاد. وتجدر الإشارة إلى أن مصدر البيانات 
الخاصة بسوق التشغيل هو نظام .ODS‏ 


مستودعات بيانات المؤسسة (EDW)‏ 

A‏ مستودعٌ بيانات المؤسسة (5810117) مستودعً بيانات واسع النطاق يُسِتَخدّم لدعم القرار 
في جميع أنحاء المؤسسة. توفَّر طبيعة (82117) الواسعة النطاق تكامل البيانات القادمة من 
العديد من المصادر في شكلٍ قياس لتطبيقات ذكاء الأعمال الفعّالة وتطبيقات دَعْم القرار. يتم 
استخدامٌ (8101175) لتوفير بيانات للعديد من أنواع أنظمة دعم القرار (1055): بما في ذلك إدارة 
علاقات العملاء (6183/1). وإدارة سلاسل التوريدات (502/1). وإدارة أداء (BPM) JUS‏ 
ومراقبة نشاط العملء وإدارة دورة حياة المنتتج. وإدارة الإيرادات وأحيانًا حتى أنظمة إدارة 
المعرفة. وتوضّح الحالة egito de sae (VY) daas]‏ من المزايا التي تعود إيجابيًا على شركات 
الاتصالات من جرَّاء تنفيذها لحلول تحليلات البيانات المخرّنة في المستودع. 


البيانات الوصفية: 

تُعرّف البيانات الوصفية بأنها بيانات تصف بيانات (على سبيل المثال: انظر 
5 ,2130 :2004 ,562). وتقوم البيانات الوصفية بِوَصْف بنية البيانات وبعض معانيها؛ مما 
à eaa‏ استخدامها الفعّال أو غير الفعال. أشار ميهرا (0١٠٠٠م)‏ إلى أن عدداً قليلاً من المنظمات 
تتفمّم بالفعل طبيعة البيانات الوصفية» ويتفهم ع ددٌ أقل من الأول لكيفية تصميم وتنفيذ 
إستراتيجية للبيانات الوصفية. ويتمٌ تعريف البيانات الوصفية بشكل عام؛ من حيث الاستخدام 
كبيانات وصفية تقئية أو بيانات أعمال. وعد الأاط طريقة أغرى لغرض البيانات الوصفية: إذ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري v‏ 


الفصل الثالث 


Lus‏ من منظور نمطي JS ae GË ol‏ من البيانات الوصفية النحوية (أيْ: البيانات التي تَصف 
بناء جملة البيانات) والبيانات الوصفية الهيكلية (أيّ: البيانات التي تَصِف بنية البيانات) والبيانات 
الوصفية ذات الدلالات اللفظية (أيْ: البيانات التي تَصِف معنى البيانات في مجال معين). 


حالة عملية ٠-۳‏ 
خطة بيانات أفضل: تستفيد شركات الاتصالات الجيدة التأسيس من مستودعات 
البيانات والتحليلات؛ للبقاء على القمة في صناعة تنافسية 

جَنَت شركاتٌ الاتصالات - التي ساعدت على تحفيز النمو الهائل لهذه الصناعة في 
أواسط وأواخر تسعينات القرن الماضي- منذ فترة طويلة فوائد أن تكون أول سوق (أيْ: 
الريادة في هذا الحقل). ولكن للحفاظ على القدرة التنافسية؛ يجب على هذه الشركات 
تحسين كلّ شيء باستمرار بدءًا من خدمة العملاء إلى تخطيط الأسعار. وفي الواقع؛ تواجه 
شركات الاتصالات الجوالة امخضرمة العديد من نفس التحَدَّيات التي تواجهها الشركات 
الصاعدة. مثل: الاحتفاظ بالعملاءء وخفض التكاليف» وتحسين نماذج التسعيرء ورَفْع مستوى 
رضا العملاء» واكتساب عملاء جُددء وَقَهُم دور وسائل الإعلام الاجتماعية في ولاء العملاء. 

تلعبُ تحليلاتٌ البيانات العالية الاستهداف دورًا أكثر أهميةً في مساعدة شركات 
الاتصالات الجوالة على تأمين أو تحسين مكانتها في سوق تتزايد فيه المنافسة. وفيما يلي: 
كيف يعمل بعض كبار مُرْؤّدي الخدمات في العالم على إنشاء مستقبل قوي قائم على 
الأعمال التجارية القوية وذكاء العملاء. 

المحافظة على العملاء: 

قد لا يخفى على أحد أن السرعة والنجاح اللذين يتعامل بهما مُقدَّم الخدمة مع 
طلبات الخدمة يؤثران بشكل مباشر على مستوى رضا العملاءء وبالتالي اميل إلى التسرب. 
لكن التحَدَّي هنا هو الوصول إلى alga‏ التي لها أكبر الأثر. 

تدوّن روكسان جارسيا - مديرة مركز العمليات التجارية لشركة 
Telefónica de Argentina‏ - في ملاحظاتها: «إذا تمَكَنَا من تتبّع الخطوات المتبعة مع 
JS‏ عملية؛ فيمكننا أن نفهم نقاط الفشل والتسارع» كما هكننا قياس تدفقات العمل 
داخل الوظائف وفيما بينهاء والتنبؤ مؤشرات الأداء بدلا من الاستجابة لهاء ورفع مستوى 
الرضا العام عن تشغيل عملاء جدد». 


vé‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


كان حل الشركة؛ هو مشروع التتبّع الذي بدأ ب ٠١‏ لوحات معلومات في عام 
۹م. ومنذ ذلك الحين؛ حقَقّت الشركة عائدات سنوية قدرها ۲,٤‏ مليون دولار 
أمريي ووفورات في التكاليف. وتقليص وقت اكتساب العملاء الجدد. وانخفاض في عدد 
تسرب العملاء بنسبة ٠لا‏ 

تقليل التكاليف: 

يعتمد البقاءٌ على القمة في أيّ صناعة في جزءٍ كبيرٍ منه. على الحفاظ على التكاليف 
dol à‏ مستوياتها. بالنسبة لشركة 2دمء»1»1 5عنا8/ن801 الفرنسية» تم خَفْضُ التكلفة 
بصورة آلية. يقوم 412012 - وهو نظامُ إدارة عمليات التسويق القائم على شركة 
labs‏ - بنقل عمليات الإنتاج التسويقية المباشرة إلى الصورة الآلية. وقد تخَطّت 
مدخراتها في عام واحدٍ أكثر من مليون دولار؛ في حين تضاعفت تكاليف حملة البريد 
الإلكتروني الخاصة بها وإنتاج المحتوى ثلاثة أضعاف. 

تقول كاثرين كورادو - مديرة المشروع الرائدة في مجال المبيعات ومديرة اتصالات 
التجزئة: «إِنَّ هدفنا هو أن تكون أكثر إنتاجيةً واستجابةٌ لتبسيط العمل الجماعي» 
ولتوحيد وحماية خبراتناء يجعل نظام 412415 أعضاء الفريق يركّزون أكثر على القيمة 
المضافة للعمل؛ من خلال تقليل المهامٌ ذات القيمة المنخفضة؛ فتكون النتيجة النهائية 
المزيد من الجودة والإبداع في ا لمخرجات». 

هناك فائدة غير مقصودة من 412015؛ ولكنها مُرخَّبٌ بها للغايةء وهي أنه تمَّ إلهامٌُ 
الإدارات الأخرى بِبَدْء تَشْر مشاريع مماثلة لكلّ شيء بدءًا من دعم مركز الاتصال وانتهاءً 
بعمليات إطلاق ال منتجات/ العروض الترويجية. 

اكتساب العملاء: 


مع اختراق السوق بنسبة *٠٠١‏ أو أكثر في العديد من الدول: وبفضل المستهلكين 
الذين يمتلكون أجهزةً متعددةً؛ فإنَّ مسألة كَنْبٍ Éz Y oih Mas‏ تحدياً صغيراً. كما 
تواجه شركة Mobilink‏ - أكبر شركة نقل في باكستان - صعوبة التشغيل في سوق يمتلك 
ja XIA dò‏ المستخدمين خطةً مسبقة الدفعء والتي تتطلّب مشتريات منتظمة من 
الدقائق الإضافية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vro‏ 


الفصل الثالث 


القدرة على تعزيز هذا الجانب من النموٌ التدريجي. لقد منحنا نموذجنا لمعلومات 

المبيعات تلك القدرة؛ لأنها ساعدت فريق المبيعات على رَسْم خطط المبيعات القائمة 

على الإستراتيجيات الأكتر ذكاءً وا لمستندة على البيانات والتي تساعدنا على تزويد مُورّدينا 

ببطاقات ال 5121 وكروت الخدش وقدرات زيادة الرّصيد الإلكتروني بشكلٍ كامل». 
ونتيجة لذلك؛ م تکسب olj Mobilink‏ في عدد اممشتركين بنسبة XY‏ فحسب؛ بل 

زادت أيضًا من اكتساب عملاء جدد بنسبة >٤‏ وتحسين ربحية تلك اممبيعات بنسبة .٤‏ 
شبكات التواصل الاجتماعي: 


يعمل التوشّع في استخدام شبكات التواصل الاجتماعي على تغيير عدد المنظمات 
التي تتعامل مع كلّ شيء بدءًا من خدمة العملاء» مرورًا بالمبيعات وانتهاءً بالتسويق. 
ويتجه المزيدٌ من شركات الاتصالات إلى تحويل اهتمامها بالشبكات الاجتماعية؛ لفهم 
سلوك العملاء والتأثير فيه بشكلٍ أفضل. 

وقد بادرت Llai gråa gb Mobilink‏ الشبكات الاجتماعيةء والذي سوف 
كن الشركة من استكشاف مفهوم التسويق الفيروسي وتحديد المؤثرين الرئيسين الذين 
تمكنهم العمل كسفراء علامة تجارية لبيع المنتجات. وتبحث 761053 عن مؤثرين 
رئيسين مشابهين إضافةً إلى عملاء منخفضي القيمة؛ إذ يُمكن الاستفادة من قيمتهم 
الاجتماعية لتحسين العلاقات القائمة. وفي نفس الوقت؟ e^» Jl Swisscom giis‏ 
جانب الشبكة الاجتماعية لسلوك العملاء مع بقية تحليلها خلال الأشهر القليلة القادمة. 

الارتفاع إلى مستوى التحَدَّي: 

على الرغم من أن كلّ سوق يُقدَّم تحَدّيات فريدةً خاصة به؛ فِنَّ معظم شركات 
الاتصالات الجوّالة تنفق الكثير من الوقت والموارد في إنشاء وتَشْر وتنسيق الخطط 
لمواجهة كل من التحَدّيات المُومّحة هنا. والخبر السّار هو أنه مع اتساع وتطؤر الصناعة 
وتقنية الهاتف المحمول على مر السنين؛ فإنَّ حلول تحليلات البيانات التي تمَّ إنشاؤها 
لواجهة هذه التحَدّيات تُعَذ قادرةً على تلك المواجهة. 

يقوم تحليلٌ البيانات الصوتية باستخدام العملاء الحاليين» والأعمال التجارية, 
ومعلومات السوق للتنبؤ والتأثير على السلوكيات والنتائج المستقبلية. وتكون النتيجة 
النهائية؛ هي الوقوف على لَهْجِ أكثر ذكاءً وأكثر رشاقةً وأكثر نجاحًا للحصول على حصة 


سوقية وتحسين الرّبحية. 


v‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


أسئلة للمناقشة: 

-١‏ ما هي التحَدّيات الرئيسية لشركات الاتصالات؟ 

؟"- كيف تمكن لمستودعات البيانات وتحليلات البيانات مساعدة شركات الاتصالات 
في lad‏ على تحَدّياتها؟ 

ISU -Y‏ تعتقد أن شركات الاتصالات مناسبة تمامًا للاستفادة الكاملة من تحليلات البيانات؟ 
Source: Marble, C. (2013). A better data plan: Well-established TELCOSs leverage‏ 


analytics to stay on top in a competitive industry. Teradata Magazine. http://www. 


teradatamagazine.com/v13n01/Features/A-Better-Data-Plan (accessed June 2016). 


أسئلة مراجعة على القسم Y-Y‏ 

-١‏ ما هو مستودع البيانات؟ 

àS -Y‏ يختلف مستودع البيانات عن قاعدة بيانات المعاملات؟ 
SODS 5a ls -Y‏ 

ع- اذكر أوجه الاختلاف بين DM ġa JS‏ و055), .EDWs‏ 


- ما هي البيانات الوصفية؟ اشرح أهمية البيانات الوصفية. 


۳-۳ عملية مستودعات البيانات: 

تقوم المؤسساتٌ - العامة والخاصة - بِجَمْع البيانات وا معلومات واممعرفة باستمرار معدل 
متزايد السرعة وتخزينها في أنظمة محوسبة. وهنا يصبح الحفاظ على هذه البيانات والمعلومات 
واستخدامها أمرًا معقدًا للغاية؛ خاصةً مع ظهور مشكلات التوسّع. إضافةً إلى ذلك؛ يستمرٌ تزايد 
عدد المستخدمين الذين يحتاجون إلى الوصول إلى المعلومات نتيجةً لارتفاع مستوى المصداقية 
وسهولة الوصول إلى الشبكة» وخاصة الإنترنت. لقد أصبح العمل مع قواعد بيانات متعددة 
- سواء ذات مستودع بيانات متكامل أم لا - مهمة بالغة الصعوبة تتطلّب brd‏ كبيرة؛ ولكنها 
يمكن أن توفر فوائد هائلة تتجاوز تكلفتها بكثير. وكمثال توضيحيء يعرض الشكل *-" فوائد 
الأعمال التجارية لمستودع بيانات المؤسسة (81011) التي قامت تيراداتا ببنائه لصالح شركة 
تصنيع سيارات رائدة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vvv‏ 


الفصل الثالث 


n — 
ج‎ 
A 


clau, e‏ القراءة. 
الشخصية 














| 


Re‏ اتسين الكاقة الجرقة مصاريف ضمان ما تم إنتاجه أ مصروف مخفض للبنية 
٠ 5 as‏ / | |تحديد أسرع ووضع اولويات | | تحسين دقة السداد من خلال pe‏ 

م دقة تقارير الأداء البيني | | وقرارات بشأن قضايا تحسين جودة بيانات | | 213 خفض التكلفة من خلال 

وإعداد تقارير PIP‏ الجودة المطالبات دمج سوق البيائات 


























Source: Tradata Corp 
القرارات المعتمدة على البيانات - فوائد الأعمال ممستودع البيانات‎ dbal Y-F JS 
تحتاجٌ العديدُ من المنظمات إلى إنشاء مستودعات البيانات» أيّ: مخازن بيانات ضخمة‎ 
لبيانات السَّلاسل الزمنية المتعلّقة بدَعْم القرار. يتم استيرادُ البيانات من مختلف الموارد الخارجية‎ 
والداخلية» ويتمٌ تطهيرها وتنظيمها بطريقة تتوافق مع احتياجات المؤسسة. وبعد مَلء البيانات‎ 
في مستودع البيانات؛ يمكن تنزيل أسواق البيانات (02/15) لمنطقة ما أو قسم معين. وبدلًا من‎ 
Aa Y las US gag EDW ذلك؛ يمكن إنشاء 221 أولًا - وفقًا للحاجة - ومن ثم دَّمْجُها في‎ 
تطوير 0۷5 وإنها يتم تنزيل البيانات ببساطة على أجهزة الحاسب الشخصية أو تركها في حالتها‎ 
الأصلية؛ من أجل معالجة بارعة مباشرةً باستخدام أدوات ذكاء الأعمال.‎ 
نعرض في الشكل 4-8 مفهوم مستودع البيانات. وفيما يلي المكوّنات الرئيسية لعملية مستودعات‎ 
البيانات:‎ 
مصادر البيانات: يتم الحصول على البيانات من عدَّة أنظمة تشغيلية مستقلة «قدهة» وربما‎ - 
من مُرْوٌدي البيانات الخارجيين (مثل: التعداد السكاني الأمريكي). وقد تأت البيانات أيضًا من‎ 
أيضًا بيانات الويب في شكلٍ‎ Gián تخظيظ موارد اللؤسمات (882). وقد‎ elbs gÍ (OLTP) 
سجلات ويب من مستودع البيانات.‎ 
التنقيب في البيانات وتحويلها: يتم التنقيبٌ في البيانات وتحويلها بشكل صحيح باستخدام‎ - 
.811. برنامج مكتوب خصيصًا أو مُعَذ تجاريًا لهذا الغرض ويُسمّى‎ 
تنزيلٌ البيانات: يتم تنزيلُ البيانات في منطقة تدريجية؛ إذ يتم تحويلها وتطهيرها. تكون‎ - 
.2215 البيانات بعد ذلك جاهزةً للتنزيل في مستودع البيانات أو في‎ 


A‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 









































التحليلات الوصفية (7): ذكاء الأعمال ومستودعات البيانات 


- قاعدة بيانات شاملة: وتُعَدٌ بشكلٍ اساي هي (5810117) لدعم تحليل القرار بصورة شاملة؛ 
مق خلال حوفي مطلومات ذاه ضلة موعزة وتفضلةفادمة من[ العديل من غار اا 

- البيانات الوصفية: يتم الاحتفاظ بالبيانات الوصفية بالصورة التي تسمحٌ بتقييمها من قبل 
موظفي ومُستخدمي التقنية. وتتضمَّن البيانات الوصفية برامج عن البيانات والقواعد المتعلقة 
بتنظيم ملخصات البيانات التي يَسِهُل فهرستها والبحث فيها؛ خاصةً مع أدوات الويب. 

- الأدوات الوسيطة: تتيح الأدوات الوسيطة الوصول إلى مستودع البيانات. ويمكن للمستخدمين 
المحترفين - كال محللين مثلًا - كتابة استعلامات :501 الخاصة بهم. يمكن للآخرين توظيف بيئة 
استعلام يتم إدارتها بصورة جيدة: مثل كائنات الأعمال؛ وذلك بغرض الوصول إلى البيانات. 
هناك العديدٌ من التطبيقات ذات الواجهات الأمامية التي يمكن لأصحاب الأعمال التفاعل من 
خلالها مع البيانات اممخرّنة في مستودعات البيانات» ا في ذلك التنقيب ف البيانات» 01۸۴ء 
أدوات إعداد التقاريرء وأدوات عرض البيانات. 


W OLAP 
لوحة المعلومات‎ 
الويب‎ 






تطبيقات (تصوير) 
إعداد تقارير 
الأعمال 
الروتينية > 
التنقيب t‏ 
الو 
ai cili ui‏ 3 








de 
مخصصة‎ 











لآ خيارات لسوق البيانات 
البيانات 


























شكل "-؟: إطار عمل وطرق عرض مستودع بيانات 


أسئلة مراجعة على القسم "-؟: 

-١‏ صف عملية مستودعات البيانات. 

؟- صف المكوّنات الرئيسية لمستودع البيانات. 
-Y‏ 336 وناقش دور الأدوات الوسيطة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


wa 






























































الفصل الثالث 


٤-۳‏ بنيات مستودعات البيانات: 
ممكن استخدامٌ العديد من فنيات نظام المعلومات الأساسية ممستودعات البيانات. وبشكل عام؛ 
عادةً ما تُسمَّى هذه الفنيات العميل/ الخادم أو البنية ذات عدد (ن) الطبقات» والتي تكون أكثرها 
شيوعًا ثنائية أو ثلاثية الطبقات (انظر الشكلين *-0 و1-8)؛ ولكن في بعض الأحيان يكون هناك طبقةٌ 
واحدةٌ فقط. ومن المعروف أنَّ هذه الأنواع من البنيات المتعددة الطبقات قادرةٌ على تلبية احتياجات 
أنظمة المعلومات الواسعة النطاق» والتي تتطلب الأداءء مثل: مستودعات البيانات. وبالإشارة إلى 
استخدام الفنيات المتعددة الطبقات المتداولة في مجال مستودعات البيانات؛ فإن هوفرء وبريسكوت» 
ومکفادین (۲۰۰۷) فرقوا بين هذه الفنيات من خلال تقسيم مستودع البيانات إلى ثلاثة أجزاء: 
-١‏ مستودع البيانات نفسه: والذي يحتوي على البيانات والبرامج المرتبطة به. 
"- برنامج الحصول على البيانات (النهاية الخلفية): والذي يستخرج البيانات من الأنظمة القديمة 
وامصادر الخارجيةء ومن ثم يقوم بدَمُجها وتلخيصها وتنزيلها في مستودع البيانات. 
-٠‏ برنامج العميل (الواجهة الأمامية): والذي يسمح لجميع ال مستخدمين بالوصول إلى البيانات 
-(a DSS/bi/business analytics [BA] engine) 5524 (a laLlos‏ 


طبقة 3 طبقة 2 طبقة 1 
خادم قاعدة البيانات خادم التطبيق مكان عمل العميل 


شكل "-0: بنية مستودع البيانات ثلاثية الطبقات 


" um S e 
Poet O 
س‎ A X. 
1 طبقة 2 طبقة‎ 
خادم التطبيق وقاعدة البيانات مكان عمل العميل‎ 


شكل "-1: بنية مستودع البيانات ثنائية الطبقات 


Yes‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 














التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


في بنية ثلاثية الطبقات؛ تحتوي الأنظمة التشغيلية على البيانات والبرمجيات؛ لحَضْر البيانات 
في طبقة واحدة (أيْ: الخادم)» ويكون مستودعٌ البيانات في طبقة أخرىء في حين تحتوي الطبقة 
الثالثة على محرك 255/81/84 (أَيّْ: خادم التطبيق) والعميل (انظر: شكل *-0). تتم معالجة 
البيانات من المستودع مرتين» ويتمٌ إيداعها في قاعدة بيانات إضافية ومُتعدّدة الأبعاد تمّ تنظيمها 
لسهولة عمل تحليل وعَرْض مُتعدّد cols‏ أو نسخها في 2215. وتتمثل مَيّْزَة البنية الثلاثية في 
فصلها عن وظائف مستودع البيانات؛ مما يلغي قيود ال موارد ويُسِهّل إنشاء DM‏ 

وفي بُنية من مستويينء يعمل محرك 058 فعليًا على نفس النظام الأساسي كمستودع للبيانات 
(انظر: شكل 7-7). ولذلك؛ فهي أكثر اقتصادًا من الهيكل الثلائي. ويمكن أن يكون للبنية ذات المستويين 
مشكلات في الأداء لمستودعات البيانات الكبيرة التي تعمل مع التطبيقات الكثيفة البيانات لدعم القرار. 

يفترض جزءٌ كبيرٌ من الحكمة الشائعة اتباع نَهْج استبداديء معتبرا أن أحد الحلول أفضل من 
الآخرء بصرف النظر عن ظروف المنظمة واحتياجاتها الفريدة. ولمزيدٍ من تعقيد هذه القرارات 
الهيكلية؛ )5 العديد من الاستشاريين ومُطوّري البرامج على جزءٍ واحد من البنية؛ مما يَحِدٌّ من 
قدرتهم ودافعيتهم على مساعدة المنظمة من خلال الخيارات القائمة على احتياجاتها. ولكن يتم 
التشكيك في هذه الجوانب وتحليلها. فعلى سبيل المثال: قدَّم (2005) 8211 معايير اتخاذ القرار 
للمؤسسات التي تخطط لتنفيذ تطبيق ذكاء الأعمال وقد حدَّد بالفعل حاجته إلى 1115 المتعددة 
الأبعاد؛ ولكنه يحتاج إلى المساعدة في تحديد البنية المتدرجة المناسبة. وتدور معاييره حول التنبؤ 
بالاحتياجات للمساحة وسرعة الوصول (للمزيد من التفاصيل انظر: 2005 8211). 

dS As‏ من مستودعات البيانات والإنترنت من التقنيات الرئيسة التي تقدّم حلولًا مهمد 
لإدارة بيانات الشركة. وينتجٌ عن دمج هاتين التقنيتين مستودعات البيانات على شبكة الإنترنت. 
ونعرض في الشكل (7-/1) هيكل مستودعات البيانات على الويب. إذ تتكون البنية من ثلاث 
طبقات» وتضمٌ عميل الحاسب وخادم الويب وخادم التطبيقات. على جانب العميل؛ يحتاج 
ا مستخدم إلى اتصال إنترنت ومتصفح ويب (يُفضّل أن يكون 1358) من خلال واجهة المستخدم 
الرسومية المألوفة (6171). ويُعَدُ وسيط الاتصال بين العميل والخوادم هو الإنترنت/ الإنترانت/ 
الإكسترانت. بالنسبة للخادم؛ يتم استخدامٌ خادم ويب لإدارة تدفق المعلومات الداخلة والخارجة 
بين العميل والخادم. وتكون مدعومةً من قبل كل من مستودع البيانات وخادم التطبيقات. 
كما يوفر مستودعات البيانات على شبكة الإنترنت العديد من المزايا الجذّابة بمما في ذلك سهولة 
الوصول واستقلالية النظام وقلة التكلفة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ye!‏ 


الفصل الثالث 


وتتشابه فنيات الويب الخاصة بمستودعات البيانات مع الفنيات الأخرى لمستودعات البيانات» 
والتي تتطلّب اختيار تصميم لإسكان مستودع بيانات الويب مع خادم المعاملات أو كخادم 
منفصل/ خوادم منفصلة. وَتُعَذُ سرعة تنزيل الصفحات أحد الاعتبارات quaai d Aa‏ 
التطبيقات المستندة إلى الويب؛ ولذلك يجب تخطيط سعة الخادم بعناية. 











€ 
صفحات الويب 
خادم التطبیق | 
العميل 
M — sali es [e‏ 
zz. EE‏ 
س االشبكة الداخلية 


Ê 
خو‎ 1 (ER 


شكل :۷-١‏ بنية تخزين البيانات القائمة على الويب 
يجب الوضع في الاعتبار العديدَ من المسائل عند تحديد أيّ بنية سوف يتم استخدامها. من بينها ما يلي: 
- ما هو نظام إدارة قواعد البيانات (8215) الذي ينبغي استخدامه؟ يتم إنشاء معظم 
مستودعات البيانات باستخدام ds dista RDBMS‏ من a Oracle‏ شركة أوراكل oracle.)‏ 
y a SQL Servers (com‏ شركة مايكروسوفت (microsoft.com/sql)‏ و1082 من شركة 
e 4BM (http//www-01.ibm.com/software/data/db2)‏ الأكثر استخدامًا. يدعم Js‏ 
من هذه المنتجات كلا من العميل/ الخادم والهياكل المبنية على شبكة الإنترنت. 
- هل ستتمٌ المعالجة على التوازي أم على التوالي؟ تمكّن المعالجة المتوازية العديد من وحدات 
المعالجة المركزية (CPU)‏ 5 معالجة طلبات استعلام مستودع البيانات آنيّا كما توفر القابلية 
للتوشع كلما لزم الأمر. يحتاج مُصمّمو مستودع البيانات إلى تقرير ما إذا كان سيتمٌ تقسيم 
جداول قاعدة البيانات (أيْ: تقسيمها إلى جداول أصغر)؛ من أجل كفاءة الوصولء وتحديد 
المعايير التي ستُستخدّم في المعالجة. وهذا هو الاعتبار امهم الذي تقتضيه كميات كبيرة من 
البيانات الواردة في مستودع بيانات نموذجي. يمكن العثور على مَسّحَ حديث على مستودعات 
البيانات المتوازية وا موزّعة | )2009( .Furtado‏ لقد نجحت شركة تيراداتا (Teradata.com)‏ 
في تبَنّي هذا النهج بكفاءة, وكثيرًا ما يتم التوصية به. 


rer‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


- هل سيتمٌ استخدامٌ أدوات ترحيل البيانات لتنزيل مستودع البيانات؟ إن نقل البيانات من نظام 
قائم إلى مستودع للبيانات؛ هو مهمةٌ شاقةٌ ومُضنيةٌ. واعتمادًا على تنوّع وموقع أصول البيانات؛ 
قد تكون الهجرة إجراءً بسيطًا نسبيًا أو (على النقيض) مشروعًا يستغرق عدة أشهر. يجب 
استخدامٌ نتائج تقييم شامل لأصول البيانات الموجودة لتحديد ما إذا كان سيتمٌ استخدامٌ أدوات 
الترحيل أم لاء وإذا كانت الإجابة بنعم؛ فما هي القدرات المطلوبة في تلك الأدوات التجارية. 

- ما الأدوات التي سيتم استخدامها لدعم استرجاع البيانات وتحليلها؟ في كثيرٍ من الأحيان» يكون 
من الضروري استخدام أدوات مُتخصّصة لتحديد مواقع البيانات الضرورية والوصول إليها 
وتحليلها واستخراجها وتحويلها وتنزيلها بشكلٍ دوري في مستودع البيانات؛ إذ يجب اتخاذ قرار 
بشأن اختيار أحد البدائل: -١‏ إما تطوير أدوات الترحيل داخلمًاء أو ۲- شراؤها من جهة خارجية 
أو - استخدام الأدوات المتوفرة بنظام مستودع البيانات. وتستدعي عمليات الترحيل الفورية 
والمعقدة للغاية الاستعانة بأدوات ETL‏ لجهات خارجية مُتخصّصة. 


بُنيات مستودعات البيانات البديلة: 
على أعلى مستوى؛ يمكن تصنيفُ وجهات نظر تصميم هيكل مستودع البيانات في تصميم 

مستودع البيانات على مستوى المؤسسة (810117): وتصميم )2009 -DM (Golfarelli & Rizzi,‏ 

ونعرض في الشكل (-8) -2 بعص البدائل لأنواع التصاميم الهيكلية الأساسية التي لا تكون 

oll (EDW)‏ ولا 01 خالصةء ولكن تتنوع بين الهياكل الفنية التقليدية أو خارجها. وتشمل 
الهياكل الجديدة البارزة كلا hub-and-spoke gs‏ والهياكل الموحّدة. تم اقتراحٌ الهياكل الخمسة 
اطبيّنة في الشكل (8-1) às .Watson (2005, 2006a,b) s Ariyachandra àh.ils; a-e‏ دراسة 
سابقة مستفيضة» 235 aas Sinha (2005)5 Sen oa JS‏ عشرة منهجية مختلفة لمستودعات 
البيانات. تُصئَّف jolas‏ هذه المنهجيات إلى ثلاث فئات عريضة: باعة التقنية الأساسية, وبائعي 

البنية التحتية» وشركات نمذجة المعلومات. 

أ- سجلات البيانات المستقلة: تمكن القول: إِنَّ هذا هو أبسط البدائل الهيكلية وأقلها تكلفةً. 
وقد تمّ تطويرٌ 10218 للعمل مستقلةً بعضها عن بعض لتلبية احتياجات الوحدات التنظيمية 
امنفردة. وبسبب استقلاليتهاء قد يكون لها تعريفات بيانات غير مُتسقة وأبعاد ومقاييس 
مختلفة؛ مما يؤدي إلى صعوبة تحليل البيانات عبر 22/5 (أيْ: إنه من الصعب» إن م يكن 
من المستحيلء الحصول على «نسخة واحدة من الحقيقة»). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yer‏ 


الفصل الثالث 


و 


€ 


هيكل حافلة سوق البيانات: يُعَذَّ هذا الهيكل بديلًا قابلًا للتطبيق ل 8215 المستقلة؛ إذ يت 
35 الأسواق المنفردة بعضها مع بعض عن طريق نوع من الوسائط. ونظرًا لأن البيانات تكون 
مرتبطةً بعضها ببعض؛ فهناك فرصةٌ أفضل للحفاظ على اتساق البيانات في جميع أنحاء المؤسسة 
(على الأقل عند مستوى البيانات الوصفية). وعلى الرغم من أن هذا الهيكل يسمح باستعلامات 
البيانات المعقدة عبر 0215؛ فإنَّ أداء هذه الأنواع من التحليل قد لا يكون مستوى مُرضٍ. 
هيكل عكاومه-لصه-طاناط: ولعلّ هذا هو أشهرٌ هيكل لمستودعات البيانات اليوم. وهنا 
ينصبٌ الاهتمام على بناء بنية تحتية قابلة للتطوير وقابلة للصيانة (غالبًا ما يتم تطويرها 
بطريقة تكرارية» أيّْ: موضوع تلو الآخر) والتي تتضمَّن مستودع بيانات مركزي والعديد من 
8 (لكل وحدة تنظيمية). تسمح هذه البنية بسهولة التخصيص لواجهات المستخدم 
والتقارير. وعلى الجانب السَّلبِي؛ تفتقر هذه البنية إلى الرؤية الشاملة للمؤسسة وقد تقود 
إلى تكرار البيانات» ووقت استجابة طويل للبيانات. 


د- مستودع البيانات المركزي: يتشابه هيكلٌ مستودع البيانات المركزي مع هيكل hub-and-spoke‏ 


vet 


باستثناء أنه لا تُوجَّد 2215 تابعة؛ ويُوجَد بدلًا منها 8511 عملاقًا يلبّي احتياجات جميع 
الوحدات التنظيمية. يوفَّر هذا النَّهج المركزي للمستخدمين إمكانية الوصول إلى جميع 
البيانات الموجودة في مستودع البيانات بدلا من حصرها في 2215. وإضافةً إلى ذلك؛ فإنه 
يقلّل من كمية البيانات التي يتعَيّن على الفريق الفني نقلها أو تغبيرهاء وبالتالي تبسيط إدارة 
البيانات وقيادتها فنيًا. وإذا تمّ تصميمه وتنفيذه بشكلٍ صحيح؛ فإن هذا الهيكل يوفْر رؤيةٌ 
شاملةً في الوقت المناسب عن المشروع لأيّ شخص في أيِّ وقتٍ أينما كان داخل ال منظمة. 

مستودع البيانات الموحّد: eai Asi‏ الموحّد بمثابة امتياز للقوى الطبيعية التي تفجّر أفضل 
الخطط لتظوير نظام مثالي. ويستخدم جميع الوسائل الممكنة لدمج الموارة التخليلية 
القادمة من مصادر مُتعدّدة لمقابلة الاحتياجات المتغيرة أو ظروف العمل. وبصورة أساسية؛ 
ينطوي النهج ا موحد على دمج أنظمة متباينة. وفي البنية الموحدة؛ يتم ترك هياكل دَعْم 
القرار القائمة في مكانهاء ويتمٌ الوصول إلى البيانات من تلك المصادر كلما لزم الأمر. كما يتم 
دَعْم النهج الموحّد من قبل مُورّدي البرامج الوسيطة الذين يقترحون الاستعلامات الموزّعة 
والقدرات المشتركة. تقدّم هذه الأدوات القابلة للتجديد والقائمة (XML) jsl äi de‏ 
للمستخدمين رؤيةً شاملةٌ لمصادر البيانات المورّعة: بما في ذلك مستودعات البيانات» و 
5 والواقع الإلكترونية والمستندات والأنظمة التشغيلية. عندما يختار المستخدم كائنات 
الاستعلام من هذا العرض» ويضغط زر الإرسالء تقوم الأداة بالاستعلام التلقاني عن المصادر 
الموزّعة» وتضم إليها النتائج ومن ثم تُقدّمها للمستخدم. وبسبب مشكلات الأداء وجودة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


البيانات؛ يتفق معظم الخبراء على أن الطرق المتبعة تعمل بشكلٍ جيد لتكملة مستودعات 
البيانات وليس استبدالها (انظر: 2005 يدهه5عككء8). 


هياكل مستقلة لأسواق البيانات [Tta]‏ 


أسواق بيانات مستقلة 


أ (بيانات صغيرة / موجزة ) 





هيكل حافلة سوق البيانات مع أسواق البيانات مرتبطة الأبعاد (b)‏ 


بيانات محددة الأبعاد , |f‏ 
نات محددة IT‏ 7 | 
الوصول للمستخدم ومربوطة بأبعاد متطابقة منطقة أنظمة | 
ERN |‏ (بيانات صغيرة / موجزة ) التدريج كم 


(c) &$ All caLagkza 34a) Hub-and Spoke Jum 


ETL 


الوصول للمستخدم مستودع علائقي طبيعي منطقة أنظمة 
النهائي Gab‏ ربيانات صغيرة) التدربج المصدر 





هسيكل مستودع البيانات المركزي (d)‏ 











A-Y J‏ هياكل بديلة لمستودع البيانات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yeo‏ 























الفصل الثالث 


às‏ 6 حدّد js‏ من 13018عهترن4 وده11185 عشرة عوامل من المحتمل أن تؤثر على 
قرار اختيار الهيكل المستخدّم: 
-١‏ ترابط المعلومات بين الوحدات التنظيمية. 
۲- احتياجات معلومات الإدارة العليا. 
۳- الضرورة الملحَّة طمستودع البيانات. 
-٤‏ طبيعة مهام المستخدم النهائي. 
-٥‏ القيود على الموارد. 
1- عَرْض إستراتيجي ممخزن البيانات قبل التنفيذ. 
۷- التوافق مع الأنظمة الحالية. 
۸- القدرة الماموسة لفريق عمل تقنية المعلومات الداخلي. 
9- المشكلات الفنية. 
-٠‏ العوامل الاجتماعية/ السياسية. 

وتتشابه هذه العوامل مع العديد من عوامل النجاح الموصوفة في الأدبيات الخاصة بمشاريع 
نظم المعلومات ومشروعات 255 وذكاء الأعمال؛ إذ تُعَن المسائل الفنية - بخلاف توفير التقنية التي 
تكون عمليًا جاهزةً للاستخدام - أمرًا مهمًا؛ ولكنها غالبًا لا تكون مهمةً. مثل المشكلات السلوكية, 
مثل: تلبية احتياجات المعلومات الخاصة بالإدارة العليا ومشاركة المستخدمين في عملية التطوير 
(عامل اجتماعي/ سياسي). ولكلٌ هيكل من هياكل مستودعات البيانات تطبيقات خاصة به متفاوتة 
الفاعلية» وبالتالي؛ توفر فوائد قصوى للمنظمة. ومع ذلك يبدو بشكلٍ عام أن هيكل 211 هو الأقل 
فعالية في الاستخدام. وللمزيد من التفاصيل الإضافية انظر: -Watson (2006a)و Ariyachand1a‏ 


أيّ البُنيات هي الأفضل؟ 

منذ أن أصبحت مستودعات البيانات jo Dgo zo‏ المؤسسات الحديثة: بات السؤال عن بنية 
مستودع البيانات الأفضل؛ هو موضوع المناقشة الدائمة. ويترّعُم هذه المناقشات اثنان من زعماء 
مجال مستودعات البيانات: ii ġe Inmon gla ls Gla$ .Ralph Kimballs Bill Inmon :l.‏ 
hub-and-spoke‏ (مثل: مصنع المعلومات المؤسسية)» I$ DM Ja ild Kimball z535 g> ġ‏ 
الأبعاد المطابقة. وهناك هياكلٌ أخرى ممكنة؛ ولكن هذان الخياران هما نهجان مختلفان جوهريًاء ولكل 
منهما مناصرون أقوياء. ولإلقاء الضوء على هذا السؤال المثير للجدل أجرى Ariyachandra y JS‏ 
و(20069) 1080502 دراسةً تجريبيةً. ولجمع البيانات قاما بإجراء استطلاع على الويب استهدفا فيه 
e1‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


الأفراد المشاركين في عمليات تنفيذ مستودع البيانات. تضمّن الاستطلاعٌ أسئلةً شخصيةً عن القائم 
بالإجابة عنه» وعن شركته» ومستودع بيانات الشركة ومدى نجاح هيكل مستودع البيانات. 

إجمالا؛ قدّم 46 من المجيبين معلوماتٍ LE‏ للاستخدام. وتراوحت الشركاث التي تم 
استطلاعها من صغيرة (ذات عائد أقل من ٠١‏ مليون دولار) إلى كبيرة (ذات عائدات تزيد على 
٠‏ مليار دولار). كانت معظم الشركات موجودةً في الولايات المتحدة بنسبة بلغت QV)‏ 
fegar Uling‏ متنوعةً من الصناعات» وشكلت صناعة الخدمات اممالية معظم الاستجابات 
بنسبة بلغت .)<٠١(‏ كانت البنية السائدة؛ هي بنية ء)همء-لده-طناط بنسبة (۹<)ء تليها 
بنية الحافلة (۲)ء ثم البنية ا مركزية بنسبة (۱۷)» ثم هيكل 21/5 المستقل بنسبة (ANY)‏ 
وجاء في ا مرتبة الأخيرة الهيكل المتحد بنسبة (6*). وكان النظام الأساسي الأكثر شيوعًا لاستضافة 
مستودعات البيانات هو 01816 بنسبة (Xy) å (Microsoft) 23545 Sols lb :»)”5١(‏ 
ثم 18M‏ بنسبة (۱۸). وتراوح معدل (متوسط) الدخل الإجمالي من ۲,۷ مليار دولار أمريكي 
ل2315 المستقلة إلى 7 مليار دولار للهيكل المتحد. وقد استخدموا أربعة مقاييس لتقييم 
نجاح الهياكل: )١(‏ جودة ا معلومات» (؟) جودة النظام. () التأثيرات الفردية» و(2) التأثيرات 
التنظيمية. واستخدمت الأسئلة مقياسًا من /ا نقاط؛ إذ تشيرٌ الدرجة الأعلى إلى بنية أكثر نجاحًا. 
يُوضح الجدول ٠-۳‏ متوسط نتائج المقاييس لهياكل مستودعات البيانات. 

















5 | ھیکل | ھیکل -اuط‏ الهيكل المركزي الهيكل 

المستقلة | الحافلة V)| and-spoke‏ تعتمد على 1(115) | المتحد 

£v o, ow ا01‎ | SEY جودة المعلومات‎ 

جودة النظام £30 | 9,41 0,01 0,1 اع 

0,0۱ o£ on 0,۰۸ | 0,۰۸ التأثيرات الفردية‎ 

التأثيرات التنظيمية 1 EW 0,۳ o,f O, | £V‏ 
وكما تشيرُ نتائجٌ الدراسة؛ سجّلت 87315 المستقلة أدنى الدرجات على جميع المقاييس. وتؤكّد 





هذه النتيجة على الحكمة التقليدية التي تقول بضعف الحلّ الهيكلي الُقَدَّم من 2218 المستقلة. 
وجاء الهيكل الموخَّد في المركز قبل الأخير. وتمتلك الشركات في بعض الأحيان منضَّات دعم قرارات 
متباينة ناتجة عن عمليات الاندماج فيما بين الشركات» وقد تختار الطريقة ا متحدةء على الأقل 
على المدى القصير؛ إذ تشيرٌ النتائج إلى أنَّ الحلّ المقدّم من الهيكل المتحد ليس هو الأمثل على 
المدى الطويل. لكن الشيء المثير للاهتمام هو التشابه في المتوسطات بالنسبة لكل من الحافلة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yev‏ 




















الفصل الثالث 


hub-and-spokes‏ والهياكل المركزية. وتكون الاختلافات صغيرة بما فيه الكفاية؛ بحيث لا يمكن 
تقديمٌ أيّ مطالبات لتفوق هيكل معين على الهياكل الأخرى. على الأقل استنادًا إلى مقارنة بسيطة 
بين هذه المقاييس للنجاح. كما قاموا بِجَمّع بيانات عن النطاق (والتي يتراوح من وحدة فرعية 
إلى نطاق الشركة) وحجم (أَيْ: كمية البيانات اممخرنة) ا لمستودعات. 

کما وجدوا of‏ نة hub-and-spoke‏ تُستخدّم bole‏ مع تطبيقات أكثر على مستوى اللؤسسة 
ومستودعات أكبر. وقاموا أيصًا بالتحقيق ف التكلفة والوقت اللازمين لتنفيذ الهياكل المختلفة. 
g2 hub-and-spoke å Col tele JS‏ الأكثر تكلفةً واستهلاكًا للوقت لتنفيذها. 


أسئلة مراجعة على القسم :£-Y‏ 

-١‏ ما هي أوجه التشابه والاختلاف الرئيسية بين هيكلٍ من طبقتينء وهيكل ثلافي الطبقات؟ 

؟- كيف أثر الويبٌ على تصميم مستودع البيانات؟ 

-٣‏ اذكر هياكل مستودعات البيانات البديلة التي تمت مناقشتها في هذا القسم. 

ع- ما هي المسائل الواجب أخذها في الاعتبار عند تحديد البنية التي ستّستَخْدَّم في تطوير 
مستودع البيانات؟ اذكر أهمّ ٠١‏ عوامل. 

i -0‏ من JSl‏ مستودعات البيانات هو الأفضل؟ وطاذا؟ 


:)٤۲1( تكامل البيانات وعمليات الاستخراج والتحويل والتنزيل‎ ٥-۳ 

إن الضغوط التنافسية العالمية. والطلب على عائد الاستثمار (101)» والإدارة والاستفسار عن 
المستثمرين واللوائح الحكومية؛ كل هذه الأمور تجبر مديري الشركات على إعادة التفكير في كيفية 
دَمْج وإدارة أعمالهم: وعادةً ما يحتاج صانعٌ القرار أن يصل إلى مصادر متعددة للبيانات» والتي 
يجب أن تكون متكاملةً. وقد كانت عمليةٌ الوصول إلى مصادر البيانات عمليةً شاقةٌ وكبيرة؛ وذلك 
قبل مستودعات البيانات» و0۷5 وبرمجيات ذكاء الأعمال. وحتى مع أدوات إدارة البيانات 
الحديثة والتي تعتمدٌ على شبكة الإنترنت؛ فإن التعرّف على البيانات التي يمكن الوصول إليها 
وتقديمها إلى صانع القرار هي مهمةٌ غير ضروريةء غير أنها تتطلب متخصصين في قواعد البيانات 
ومع نمو حجم مستودعات البيانات تزداد مشكلات دمج البيانات هي الأخرى. 

dalos Ól‏ الأعمال يحتاج إلى تطؤر مستمر؛ إذ تكن لعمليات الاندماج والاستحواذ والمتطلبات 
التنظيمية وإدخال قنوات جديدة أن تؤدي إلى تغييرات في متطلبات ذكاء الأعمال. وإضافةً إلى 
البيانات التاريخية والمنظفة والموحّدة والمتحصّل عليها في الوقت المناسب؛ فإنَّ مُستخدمي الأعمال 


YEA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


يحرصون على الوصول إلى البيانات غير المهيكلة في الوقت المناسب بدون تأخير. ويجبٌ أن يتكامل 
js‏ شيءِ مع محتويات مستودع البيانات الموجود. be‏ على ذلك؟ أصبح Jag‏ عبر أجهزة 
المساعد الرقمي الشخصي (۶24) ومن خلال التعرّف على الكلام والتوليف أكثر شيوعًا؛ مما يزيد 
من تعقيد قضايا التكامل (2003 ,84188545). وتتضّمَّن العديدٌ من مشاريع التكامل أنظمةً على 
مستوى المؤسسة. وقد  Orovic e38‏ ۲۰۰۴م قانمةً مرجعيةً مما يصلح وما لا يصلح عند محاولة 
القيام بمشروع من هذا القبيل. ومن الصعب دَمْجٌ البيانات التي تأت من قواعد بيانات مختلفة 
وغيرها من المصادر المتباينة؛ خاصةً عندما لا يتمُ ذلك بشكل صحيح؛ إذ إنه من الممكن أن يؤدي 
إلى كارثة في أنظمة واسعة النطاق مثل 013/1 ع15188. ومشاريع سلاسل (Nash, 2002) 4; 5l‏ 
تكامل البيانات: 

يشتملٌ als‏ البيانات على ثلاث عمليات رئيسية؛ هذه العمليات عندما يتم تنفيذها بشكل 
صحيح؛ فإنها تسمح بالوصول إلى البيانات وإتاحتها مجموعة من ETL‏ وأدوات التحليلء وبيئة 
مستودعات البيانات» وهذه العمليات هي: الوصول إلى البيانات: وتعني القدرة على الوصول 
إلى البيانات واستخراجها من أيّ مصدر بيانات, اتحاد البيانات؛ أيْ: تضمين آراء الأعمال في مخزن 
البيانات المتعددة: تغيير الالتقاط؛ والذي يتم بناءً على تحديد التغييرات التي تمَّ إدخالها على 
مصادر بيانات ا مؤسسة. انظر الحالة العملية ۲-۳ للاطلاع على مثالٍ لكيفية الاستفادة من BP‏ 
4ه 1طنا] في تنفيذ مستودع بيانات يدمج البيانات من عدة مصادر. فقد قام بعص المورّدين» 
مثل 12 ,10516006 545 بتطوير أدوات تكامل البيانات بشكل قوي. ويتضمّن مشروع تكامل 
البيانات 545 للمؤسسة أدوات تكامل بيانات العملاء التي تعمل على تحسين جودة البيانات في 
عملية التكامل. OLLI LiG de Lf Oracle Business Intelligence Suite aclis LS‏ 

ويتمثل الغرض الرئيسي من مستودع البيانات في دَمُج البيانات من أنظمة مُتعدّدة؛ بحيث 
eus‏ تقنيات التكامل المختلفة دمج البيانات والبيانات الوصفية: 
- تكامل تطبيقات المؤسسات (EAI)‏ 
- العمارة الموجهة نحو الخدمة (SOA)‏ 
- تكامل معلومات المؤسسة EIT)‏ 
- الاستخراج والتحويل والتحمیل (ETL)‏ 

يوفّر تكاملٌ تطبيقات المؤسسات (۸1) وسيلة لدفع البيانات من أنظمة المصدر إلى مستودع 
البيانات. وهو ينطوي على دَمْج وظائف التطبيقات ويركز على مشاركة الوظائف (بدلًا من 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yea‏ 


الفصل الثالث 


البيانات) عبر الأنظمة» وبالتالي تمكين المرونة وإعادة الاستخدام. وعلى نحو تقليدي؛ فقد رگزت 
حلول تكامل تطبيقات المؤسسات (541) على تمكين إعادة استخدام التطبيق على مستوى واجهة 
برمجة التطبيقات. وفي الآونة الأخيرة؛ يتم إنجاز تكامل تطبيقات المؤسسات (841) باستخدام 
خدمات (504) (والتي هي مجموعة من العمليات أو المهام التجارية) التي تم تعريفها وتوثيقها 
بشكلٍ جيد. idg‏ استخدام خدمات شبكة الإنترنت طريقةً مُتخصّصةً لتنفيذ (804). كما كن 
استخدامٌ Jat (EAT)‏ الحصول على البيانات مباشرةٌ في مستودع بيانات شبه فوري أو لتوصيل 
القرارات إلى أنظمة 011۶ء وهناك العديدٌ من الطرق والأدوات المختلفة لتنفیذ (۴۸1). 

iig‏ تكامل معلومات المؤسسات (811) مجالًا جيدًا باعتباره أداةً متطورةً تقومٌ بدَمْج 
البيانات الواردة من مجموعة متنوعة من المصادر في الوقت ال محدّدء مثل: قواعد البيانات 
المترابطة» وخدمات شبكة الإنترزنت» وقواعد البيانات اممتعددة الأبعاد؛ بالإضافة إلى كونه &JI‏ 
لسَحْبٍ البيانات من أنظمة المصدر لتلبية طلب الحصول على المعلومات. وتستخدم أدوات (811) 
بيانات التعريف المعرّفة مسبقًا لتجميع وجهات النظر التي تجعل البيانات المدمجة (المتكاملة) 
تبدو مرتبطةً بالمستخدمين النهائيين. وقد يكون .20011 هو الجانب الأكثر أهميةً في 1:11؛ وذلك لأن 
XML‏ يسمح بِوَضْع علامات على البيانات إما في وقت الإنشاء أو في وقت لاحقء وهذه العلامات 
يمكن توسيعها وتعديلها بما يسمح باستيعاب أي مساحة من المعرفة (انظر: 2005 .(Kay,‏ 

ولطالما كان تكامل البيانات المادية؛ هو الآلية الرئيسة لصُنْع نظرة متكاملة مع مستودعات 
البيانات و2245. ومع ظهور أدوات تكامل معلومات المؤسسة (1811) (انظر: 2005 (Kay,‏ فإن 
أنماط تكامل البيانات الافتراضية الجديدة أصبحت مُحِدِيةٌ وقابلةً للتطبيق» وقد ناقش كل من 
Mehra (2005)5 Manglik‏ 3155 3 25,55 أنماط تكامل البيانات الجديدة التي يمكن أن توسّع 
المنهجيات المادية التقليدية لتقديم رؤية شاملة للمشروع. 


حالة عملية ۲-۳ 
بريتش بتروليوم 88 بلواد التشحيم تحقق نجاح 8185 
قامت شركة بريتش بتروليوم لزيوت التشحيم بتأسيس برنامج 8185 ممتابعة نشاط 
الذّمج الأخير لتوفير معلومات إدارة متسقة وشفافة على مستوى العام؛ إضافة إلى تقديم 
ذكاء الأعمالء و8185 في الوقت المناسب والذي يوفر عرضًا تفصيليًا ومتكاملًا للأداء عبر 
وظائفء مثل: التمويلء والتسويق والمبيعات» والإمدادات وخدمات التخطيط والتنفيذ. 


vo.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


وتََّذُ 81 واحدةً من أكبر مجموعات النفط والبتروكيماويات في العام؛ ]3 Ie- As‏ 
من مجموعة ام 88؛ فشركة 88 لمواد التشحيم هي شركةٌ رائدة في سوق السيارات 
العامة وتشتهر الشركة بعلامة زيوت كاسترول (025]:01) التجارية. كما تعمل في أكثر 
BP 35,5 5l‏ 





من ماكة دولة ولديها عشرة آلاف موظف. ومن الناحية الإسترات 


لواد التشحيم تركّز على تحسين خدمة عملائهاء وزيادة فاعليتها في أسواق السيارات. 
s‏ أعقاب نشاط الاندماج مؤخرًا تمر الشركة بعملية تحؤل لتصبح أكثر فاعليةٌ ومرونة 
واغتناماً لفرص النمو السريع. 


التحَدّي: 

عقب نشاط الاندماج الأخير أرادت شركة 85 لمواد التشحيم تحسينَ الاتساق 
والشفافية» وسهولة الحصول على معلومات الإدارة وذكاء الأعمال. وللقيام بذلك كان 
من الضروري دَمْج البيانات المُحتقّظ بها في أنظمة مصدر معدل التوزيع دون التأخير في 
إدخال نظام مُوخّد لتخطيط موارد المؤسسات. 

الحل: 

نفدت شركة 82 للواد التشحيم برنامج «ذكاء الأعمال التجارية والمعايير العالمية» 
aa cas (BigS)‏ إستراتيجيةٌ لإدارة وذكاء الأعمال. وف لَب برنامج 8185 يُوجَد ما يُسمّى 
0 وهو حل 81011 التكيّفي لإعداد وتنفيذ وتشغيل وإدارة مستودعات البيانات. 

وقد أسهم j‏ 5117 المتكامل من 1281140 في دَعُم تكامل البيانات المعقدة للبرنامج 
التجريبي ومتطلبات تقديم التقارير ا متنوعةء وللتكيّ ف مع متطلبات إعداد التقارير 
المتطوّرة للبرنامج؛ فقد تمكَّن البرنامج أيضًا من تعديل بنية المعلومات الأساسية بسهولة 
عالية مع الحفاظ على جميع المعلومات؛ إذ يقوم النظام بِدَّمْج وتخزين المعلومات من 
أنظمة مصادر متعددة لتوفير طرق عرض مُوخّدة من أجل: 

- تسويق العائدات والهوامش الخاصة بالعميل بالنسبة لقطاعات السوق مع 
التعمق في تفاصيل مستوى الصوت. 

- زيادة التقارير الخاصة بفواتير المبيعات والتكاليف الجمركية التفصيلية والرواتب الفعلية. 

- تقديم بيانات الأرباح والخسائر والميزانية العمومية وبيانات التدفق النقدي 
الموحّدة على الصعيد العالمي» مع التدقيق في مراجعة حسابات العملاء والديون 
وخدمات التخطيط والتنفيذ؛ بحيث يتم معالجة الحركة وعَرْضها من خلال نظام موحّد 
غبر منصات 8519 متعددة في نظام تخطيط موارد المؤسسات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yoy‏ 


الفصل الثالث 


الفوائد: 

توفّر 8185 المعلومات اللازمة لمساعدة الأعمال التجارية على تحديد عددٍ وافر من 
الفرص التجارية؛ من خلال تحسين رؤية البيانات المتسقة في الوقت المناسب؛ من أجل 
تحقيق أقصى قدر من فرص العمل لزيادة الهوامش أو إذارة التكاليف المرتبطة بها. 

وتتضمّن الاستجابات النموذجية لفوائد البيانات المتسقة الناتجة عن 8185 ما يلي: 

- تحسين التناسق والشفافية في بيانات الأعمال. 

- إعداد تقارير أسهل وأسرع وأكثر مرونة. 

- التوافق بين المعايير العالمية والمحلية على 45 سواء. 

- دورة تنفيذ سريعة وفعّالة؛ من حيث التكلفة بالإضافة إلى مرونتها. 

- أقل قدرٍ من الاضطراب للعمليات التجارية القائمة والأعمال اليومية. 

- تحديد مشكلات جودة البيانات والتشجيع على حَلَّها. 

- تحسين القدرة على الاستجابة بذكاء للفرص التجارية الجديدة. 

3BigS ما هو‎ -١ 

۲- ما هي التحَدّيات» وما هو الحل المقترح والنتائج التي تمّ الحصول عليها مع 8185؟ 
Sources: Kalido. BP Lubricants. http://kalido.com/download/BP-Lubricants.pdf‏ 


(accessed July 2016); BP Lubricants, www.bp.com/en/global/corporate/about-bp/ 
bp-at-a-glance.html (accessed July 2016). 


الاستخراج» والتحويلء والتحميل: 

يتضمّن الجانبٌ التقني من عملية مستودعات البيانات استخراج وتحويل وتحميل (۴۲1). 
وتقوم تقنية (۲1) - والتي كانت موجودةً منذ فترة قصيرة - بدور رئيس في العملية واستخدام 
مستودعات البيانات. وَتُعَذٌ عملية استخراج وتحويل وتنزيل البيانات (ETL)‏ عنصراً أساسياً في أي 
مشروع بيانات مركزية. وغالبًا ما يواجه مديرو تقنية المعلومات تحَذَّيات؛ لأن عملية استخراج 
وتحويل وتنزيل البيانات عادة ما تستهلك ۷٠۰‏ من الوقت في مشروع بيانات مركزية. 


Yor‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


تتكوّن عملية (.8:11) من: الاستخراج (ويعني: قراءة البيانات من قاعدة بيانات واحدة أو أكثر» 
والتحويل (أيْ: تحويل البيانات اللمستخرّجة من شكلها السابق إلى الشكل الذي تحتاجُ إليه؛ بحيث 
يمكن وضعه في مستودع بيانات أو ببساطة قاعدة بيانات أخرى)؛ إضافة إلى التنزيل (أيْ: وَضْع البيانات 
في مستودع البيانات). ويحدث التحويلٌ باستخدام القواعد أو جداول البحث أو عن طريق ذَمْجج 
البيانات ببيانات أخرى. ويتم دَمْجِ وظائف قواعد البيانات الثلاثة في أداة واحدة لسحب البيانات 
من واحدة أو أكثر من قواعد البيانات» ووَضْعها في قاعدة بيانات أخرى مُوخّدة أو مستودع بيانات. 

وتقوم أدوات (.8:11) أيضًّا بنقل البيانات بين المصادر والأهداف وتوثيق كيفية تغيّر عناص 
البيانات (كالبيانات الوصفية) في أثناء انتقالها بين المصدر والهدف؛ إضافةً إلى تبادل البيانات الوصفية 
مع التطبيقات الأخرى حسب الحاجة» وإدارة جميع عمليات التشغيل والعمليات الأخرى (مثل: 
الجدولة, وإدارة الأخطاء. وسجلات التدقيق» والإحصائيات). idg‏ عملية (8151) عمليةً في غاية 
الأهمية لتكامل البيانات» وكذلك لمستودعات البيانات. والغرض من هذه العملية. هو تنزيل 
المستودع ببيانات مُدمَجَة ومنتقاة» ومن الممكن أن تأت البيانات المُستخدّمة في عملیات(۴۲1) من 
أيّ مصدر ك: تطبيق حاسب مركزيء أو تطبيق (882) CRM 8lol s‏ أو ملف ثابت, أو جدول 
Excel oblo‏ أو حتى قائمة انتظار رسائل. وفي الشكل 5-8 نحَدّد الخطوط العريضة لعملية (ELT)‏ 


نظام قديم 





A 
داخلية أخري‎ 








شکل ۹-۳: عملیات ETL‏ 


وتنطوي عملية ترحيل البيانات إلى مستودع البيانات على التنقيب في البيانات من جميع 
المصادر ذات الصَّلَة. وقد تتكوّن مصادر البيانات من ملفات مُستخلصّة من قواعد بيانات 
OLTP‏ وجداول البيانات» وقواعد البيانات الشخصية (على «Microsoft Access :JLI Juw‏ 
أو الملفات الخارجية. وعادةً ما e‏ كتابة كافة ملفات الإدخال في مجموعة من الجداول اممؤقتة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yor‏ 























الفصل الثالث 


والتي يتم تصميمها من أجل تسهيل عملية التنزيل. ويحتوي مستودع البيانات على العديد 
من قواعد العمل التي تحَدَّد أشياءء مثل: كيفية استخدام البيانات» وقواعد التلخيصء وتوحيد 
السّمات المشفرة. وقواعد الحساب. ويجب تصحيح البيانات المتعَلّقة بملفات المصدر قبل تنزيلها 
في مستودع البيانات. ومن فوائد مستودع البيانات المصمّم تصميمًا جيدًا هو أن هذه القواعد 
يمكن تخزينها في مستودع البيانات الوصفية» وتطبيقها على مستودع البيانات بشكل مركزي. 
وهذا يختلف عن طريقة 01:52 التي تحتوي عادةً على قواعد البيانات والأعمال التجارية 
المنتشرة في جميع أنحاء النظام. ويمكن إجراء عملية تنزيل البيانات في مستودع البيانات إِمَّا من 
خلال أدوات تحويل البيانات التي توفر واجهة مُستخدم رسومية للمساعدة في تطوير وصيانة 
قواعد الأعمال التجارية» أو من خلال طرق أكثر تقليدية» مثل تطوير البرامج أو الأدوات المساعدة 
لتنزيل مستودع البيانات؛ وذلك باستخدام لغات البرمجة, مثل: لغات 9l eC sl PL/SQL‏ 
3 أو دوت نت 5873161011. وهذا القرار ليس سهلا بالنسبة للمنظمات؛ إذ تؤثر العديدٌ 
من المشكلات على قرار المؤسسة بشراء أدوات تحويل البيانات» أو إنشاء عملية التحويل نفسهاء 
وتتمثل هذه المشكلات في: 
- أدوات تحويل البيانات الغالية الثمن. 
- قد يكون لأدوات تحويل البيانات منحنى تعلّم طويل. 
- من الصعب قياس أداء منظمة تقنية المعلومات؛ حتى تتعلّم المنظمة استخدام أدوات تحويل البيانات. 

وعلى المدى الطويل؛ ينبغي تبسيط نهج صيانة أداة تحويل مستودع البيانات للمنظمة. ومن 
ا ممكن أن تكون أدوات التحويل أيضًا Hé‏ في الكشف والتنظيف (بمعنى إزالة أية حالات شاذة 
في البيانات). وتعتمد 0147 وأدوات التنقيب في البيانات على مدى جودة تحويل البيانات. 

وكمثال (ETL) de‏ الفعّالة؛ فإن شركة Motorola, Inc‏ تستخدم (۴11) لتغذية مستودعات 
البيانات الخاصة بها؛ إذ تقوم شركة 210]05014 بتجميع المعلومات من ثلاثين نظامًا مختلقًا 
ob Las‏ ومن ثم تقوم بإرسالها إلى مستودع بيانات 50241 العالمي لتحليل إجمالي إنفاق 
الشركة. (انظر: 2004 متسنعده5). 

وقد صنّف (2005) 50107202 تقنيات .8:11 إلى أربع فئات» وهي: متطورة: وممكنة, 
وبسيطة: وبدائية. ومن المسلم به عمومًا أن أدوات الفئة المتطورة ستؤدي إلى توثيق عملية 
ETL‏ بشكلٍ أفضل وأكثر دقة مع تطؤر مشروع مستودع البيانات. 


vot‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


وعلى الرغم من أنه من الممكن للمبرمجين تطوير برنامج من أجل £۲1 فإنه من الأسهل 
استخدام أداة :8:11 القائمة (الموجودة بالفعل). ونعرض فيما يلي لبعض المعايير المهمة في اختيار 
أداة :8:11 x(Brown, 2004 : 5l)‏ 
- القدرة على القراءة والكتابة إلى عدد غير محدود من أساليب بناء مصادر البيانات. 
- التقاط تلقائي للبيانات الوصفية وتسليمها. 
- تاريخ المطابقة للمعايير المفتوحة. 
- واجهة سهلة الاستخدام للمطور والمستخدم الوظيفي. 

قد يكون أداء .1:11 الشامل علامةً على سوء إذارة البيانات» ونقص أساسي في إستراتيجية إدارة 
بيانات متماسكة. وقد أشار (2006) Karacsony‏ إلى وجود علاقة مباشرة بين حجم البيانات المتكررة 
وعدد عمليات ,811 فعندما يتم إدارة البيانات بشكل صحيح كأصل لمؤسسة؛ فإن جهود .1:11 
تنخفض بشكلٍ كبير, كما يتم التخلّص من البيانات المتكررة بالكامل. مما يؤدي إلى توفير كبير في 
الصيانة وزيادة الكفاءة في التطوير الجديد مع تحسين جودة البيانات. إِنَّ سوء تصميم عمليات 
1 يجعل تكلفة صيانتها وتغييرها وتحديثها باهظة. وبناءً على ذلك؛ فإنه من الأهمية بمكان 
اتخاذ الخيارات المناسبة من حيث التقنية والأدوات لاستخدامها في تطوير وصيانة عملية ۴۲1. 

ويتوفر عددٌ من أدوات .811 المجمّعة؛ إذ يقوم مُورّدو قواعد البيانات حاليًا بتوفير 
قدرات ETL‏ التي تعمل على تحسين أدوات 11 المستقلة والتنافس معها. 5335 545 
بأهمية جودة البيانات وتقدّم أول حل متكامل تماما في هذه الصناعة ETL gou‏ 
وبيانات نوعية لتحويل البيانات إلى قيمة الأصول الإستراتيجية» ومن بين مُزودي برامج 
11 الآخرين شركات Jnformaticag IBMs .Oracles (Microsoft) C35 2:5,Sols‏ 
.Tibcog Embarcaderog‏ وللحصول على معلومات إضافية حول .8:11 انظر: Golfarelli‏ 3 
-Songini (2004) s .Karacsony (2006) .Rizzi (2009)‏ 


أسئلة مراجعة القسم :0-Y‏ 

-١‏ صف تكامل البيانات. 

؟- صف الخطوات الثلاث لعملية ۴۲1. 

۴اا شد عملية 811 is daga‏ لجهوة مسعودعاتالبيانات؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yoo‏ 


الفصل الثالث 


7-9 تطويرٌ مستودع البيانات: 
يُعَدُ مشروع مستودعات البيانات مهمةٌ كبر SÍ sas d ada GU‏ تعقيدًا من مشروع 

اختيار وتنفيذ حاسب مركزي بسيط؛ نظرًا لأنه يضم العديد من الأقسام والعديدَ من واجهات 
الإدخال والإخراج بالإضافة إلى تأثيره عليهاء كما أنه من الممكن أن يكون جزءًا من إستراتيجية عمل 
1 . ويوفّر مستودغٌ البيانات العديدّ من المزاياء والتي يمكن تصنيفها إلى مزايا مباشرة ومزايا 
غير مباشرة. وتتضمّن المزايا المباشرة ما يلي: 
- يمكن للمستخدمين النهائيين إجراءً تحليل مستفيض بطرق متعددة. 
- تكن توحيدٌ وجهات النظر فيما يتعلّق ببيانات الشركة (أيْ: إصدار صيغة واحدة للحقيقة). 
- تكن الحصولٌ على معلومات أفضل وفي الوقت المناسب؛ إذ يسمحٌ مستودع البيانات بمعالجة 

ا معلومات؛ ليتم إعفاؤها من أنظمة التشغيل المكلّفة إلى خوادم منخفضة التكلفة. ولذلك؛ فإنه 

من الممكن معالجة الكثير من طلبات الحصول على معلومات للمستخدم الأخير بسرعة أكبر. 
oS -‏ أن يؤدي إلى مستوى أداء أفضل؛ إذ يُحرّر مستودع البيانات عملية الإنتاج؛ نظرًا لأن بعض 

متطلبات تقارير نظام التشغيل يتم نقلها إلى DSS‏ 
- تبسيط الوصول إلى البيانات. 

وتنشأً المزايا غير المباشرة نتيجةً لاستخدام المستخدمين النهائيين للمزايا المباشرة. وبشكلٍ عام؛ 

فإِنَّ هذه المزايا تعَرّز ا معرفة بالأعمال التجاريةء وتقدّم فائدةً تنافسية؛ إضافةً إلى تحسين خدمة 
العملاء وإرضائهم» كما أنها aa‏ اتخاذ القراره وتساعد في إصلاح العمليات التجارية. وبالتالي؛ فإنَّ 
مستودعات البيانات تُسهم بشكلٍ قوي لإضفاء مَيْرة تنافسية للمؤسسات Parzinger & Frolick;)‏ 
1 وللاطلاع غلى مناققة مُفصّلة حول كيفية حصول المؤسسات على مستويات استثنائية من 
الأرباح؛ انظر: sis -Wixom (2002) Goodhues Watson‏ للفوائد المُحتمّلة التي يمكن أن 
يوفرها مستودع البيانات والاستثمارات الكبيرة في الوقت والمال التي يتطلبها هذا المشروع؛ فإنه 
من الأهمية بمكان أن تقوم المؤسسة بتنظيم مشروع مستودع بياناتها لتحقيق أقصى قدرٍ من فرص 
النجاح. وإضافةً إلى ذلك يجبٌ على المؤسسة بطبيعة الحال أن تأخذ في الاعتبار التكاليف. وقد 
وَصَف (2001) إ1اعك1 منهج عائد الاستثمار (201) والذي يأخذ في الاعتبار مزايا فئات عمليات 
الحفظ (أَيّ: الأموال التي يتم توفيرها من خلال تحسين وظائف دَعْم القرار التقليدية)» والجمع 
(أيْ: الأموال التي يتم توفيرها بسبب جمع المعلومات ونشرها آليًا)» والمستخدمين (أيْ: الأموال 
المحفوظة أو المُكتسّبة من القرارات التي يتم اتخاذها باستخدام مستودع البيانات). وتشمل 


voi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


التكاليف كل ما يتعلق بالأجهزة والبرمجيات: والنطاق الترددي للشبكة: والتنمية الداخلية؛ إضافةً 
إلى العم الداخليء والتدريب» والاستشارات الخارجية. ويتم حساب القيمة الحالية الصافية على 
مدى العمر اممتوقع مستودع البيانات. ونظرًا لأن ا مزايا تقس م تقريبًا إلى: ٠٠١‏ لعمليات الحفظ 
و٠‏ للجمع» و٠0‏ للمستخدمين؛ فقد أشار Caos ail I Kelly‏ إشراك ال مستخدمين في عملية 
التطوير, والذي يُعَذُ عامل نجاح حاسم للأنظمة التي تُعَنَي بالتغيير في المنظمة. 

وتُقدّم الحالة العملية ٠-٠‏ مثالًا لمخزن البيانات الذي تمّ تطويره» وتنفيذه على أساس تنافس شديد 
لشركة مبيعات تجزئة هولندية» وقد أذّى الجَمْع بين قدرات مستودعات تيراداتا التخزينية والقدرات 
التحليلية مع وجود بنية تحتية للمؤسسة باستخدام حلول 54۴ إلى تحقيق نجاح هائل في السوق. 


حالة عملية ٣-۳‏ 

استخدام تحليلات تيراداتا لحلول 548 تُسرّع عملية تسليم البيانات الكبيرة 

إِنَّ الشركة التي تمّ تصنيفها ضمن هذه الدراسة الخاصة باقتناء gall‏ هي عبارة 
عن شركة مملوكة ملكية خاصة لتاجر تجزئة هولندي» وتتكون من ۲۸٠١‏ متجرء هذا 
التاجر لديه ١0‏ علامة تجارية مختلفة عبر العديد من الدول الأوروبية. تشمل منتجات 
عديدة من ألعاب الأطفال إلى أدوات الطهي. dae (Ss‏ تجارية لها البنية التحتية 
الخاصة بها. وتتم إدارة كلّ كيان تجاري بشكلٍ مستقل عن باقي ال ٠١‏ شركة الأخرى؟ 
وذلك في طريقة تطوير عملياته. والحفاظ على أنظمة تراثه. واتخاذ القرارات التجارية 
الخاصة بالتمويل وتقنية المعلومات» وسلسلة التوريد والعمليات العامة. 


الخلفية: 


ومن أجل تلبية احتياجات بيئة تنافسية دائمة ib i$) c diaz e jS clas‏ 
للأعمال؛ وهو الأمر الذي يمثل تحديًا لمتاجر التجزئة الكبيرة لهذا التاجر الهولندي مع قيام ١0‏ 
علامة تجارية مستقلة بإدارتها. وللحصول على رؤية أفضل وزيادة كفاءة الأعمال وانخفاض 
التكاليف؛ قرَّر بائع التجزئة وَضْعَ إستراتيجية مشتركة لإدارة البيانات في نظام مركزي باستخدام 
قسم تقنية معلومات واحد. وتعني مركزية البيانات أنَّ جميع العلامات التجارية سوف تتح 
إدارتها في مستودع بيانات واحدء وتنفيذها حسب العلامة التجارية. مع مراعاة العمليات 
التجارية الفردية واحتياجات JS‏ كيان مستقل. ويتمثل أكيرُ تحدٌ يواجه متاجر التجزئة الكبيرة 
e 23 55 5 à‏ العديد من الأنظمة, Le‏ في ذلك أنظمة (1887 (SAP‏ الخاصة بال (10) علامة 
alls db js‏ إدارة المستودعات: وأنظمة نقطة البيع (205)» والبيانات الرئيسة للمواد. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vov‏ 


الفصل الثالث 


ومع التركيز على الحفاظ على مرونة الحركة التجارية للمبيعات وتحليل الهامش؛ فقد 
كان هدف تاجر التجزئة هو توفير الوصول إلى مستوى معاملات البيانات الناشئة مما 
يقرب من 6٠‏ جدول 547 داخل كل -ERP lbs‏ وقد زاد الأمرٌ تعقيرًا خاصةً فيما يتعلق 
بالانتقال إلى تهج مركزي؛ بسبب الفروق الدقيقة عبر نظام تخطيط موارد الخمس عشرة 
علامة تجارية. وقد احتاج العمل على إدخال هذه البيانات في المستودع المركزي إلى 6٠١‏ 
يوم من الجهد لكلّ نظام. وبالتالي؛ فقد احتاجوا إلى طريقة لتبرير نفقاتهم؛ وتطوير قيمة 
مقترحة مستمرة لنهج مستودع البيانات الخاصة بهم» وتطوير طريقة لتسهيل هذه العملية. 

قصة اكتساب المنتج: 

ومن الناحية التجارية؛ فإن التركيز ينصبٌٍ على إنشاء مِنضَّة تحليلية مركزية مع 
إمكانية الوصول إلى رؤية شاملة لبيانات ا معاملات. ونظرًا للطبيعة ا موسمية للتجزثة؛ 
فإن القدرة على الاستفادة من بيانات عدة سنوات أمرٌ مهم للمساعدة في تحديد 
الاتجاهات اموسميةء وإنشاء التوقعات» وتطوير الأسعار والعروض الترويجية. ويكون 
الهدف من كل ذلك هو تحسين الرؤية وتوفير حرية التحليلات عبر سلسلة التوريد والمواد 
والمبيعات والتسويق لمساعدة هذه المؤسسة لتصبح أكثر كفاءةً في طريقة عملها. وبناءً 
على ذلك؛ فقد قام بائع التجزئة باختيار قاعدة بيانات تيراداتا؛ نظرًا لأنه يمكنه التعامل 
مع تحليلات المعاملات بالإضافة إلى توفير قدرات تحليلات متقدّمة. وكان هدفهم هو 
دَعْم التحليلات التشغيلية وا مرونة عن طريق تنزيل البيانات دون تطوير نظام 101/15 
أو نماذج منطقية أخرى قبل طرح المستخدمين أسئلة الأعمال. وقد مكّتهم هذا الأسلوب 
من حفظ البيانات مركزيًا داخل قاعدة بيانات تيراداتا مع توفير المرونة ا مستقبلية التي 
تتعلق بالوصول إلى البيانات والتقارير والتحليلات لجميع العلامات التجارية. 

وفي سبيل التقليل من تعقيدات 5817 547؛ قضَّت الشركة الأشهر الستة الأولى تعمل 
بكامل جهدها؛ من أجل تكامل 547 للعملاء المحليين. وبعد ستة أشهر من العرض 
أدركوا المخاطرء وأوقفوا المشروع للتحقيق فيما إذا كانت هناك طرق أفضل للتعامل 
مع هذه المشكلة. ولأول مرة تقوم الشركة باستخدام نظام 51 547 والذي احتاج 
تقريبًا ل +٠٠0‏ يوم حتى يتم فقط تنزيلٌ البيانات من أول liss -SAP ERP J eli‏ 
الأموّلن يوفَّرَ قيمةٌ بالسرعة الكافية؛ لذلك فقد قام تاجر التجزئة الهولندي بتصعيد 
ال مشكلة بتصعيد المشكلة ومحاولة استكشاف حل جديد يعمل بطريقة أوتوماتيكية في 
حل تيراداتا جديد يعمل بطريقة أوتوماتيكية في عمليات الحصول على البيانات عند 


YOA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


استخدام 812 542. وقد وقع الاختيار على تحليلات تيراداتا لحلول js SAP‏ لأنه 
تمّ تصميمه خصيصًا لمعالجة التحَدَّيات المرتبطة بإحضار البيانات من 8187 542 إلى 
قاعدة بيانات تيراداتا. كما يوفر الحلٌ نهجًا آلا (تلقائيًا) لدَمْج È SAP ERP bly‏ 
مستودع البيانات كما مكّهم من تنزيل البيانات المطلوبة للعلامة التجارية الأولى في 
غضون 0 أيام فقط بدلا من 20١‏ يوم المقدَّرة باستخدام النظام السابق. وقد قضى بائع 
التجزئة 66 يومًا إضافيًا لإضافة 0! جدولا مخصصًا (7) وإعداد البيانات للاستهلاك. مما 
أدى إلى تسريع دَمْج بيانات 547 بنسبة :/8٠١‏ وبالتالي توفير "0٠‏ يومًا من العمل. 
Obál‏ 


يؤدي الجَمُع بين مشروع توحيد تخطيط موارد المؤسسات بالكامل عبر العديد 
من الأنظمة القديمة إلى إنشاء مشروع به العديدٌ من التعقيدات. وعلى الرغم من أن 
تحليلات تيراداتا لحلول 547 قد أتاح التشغيل التلقائي لجزء إدارة البيانات المرتبطة ب 
SAP‏ من المشروع؛ فإِنَّ تاجر التجزئة لا يزال يواجه تحديات فنية؛ بسبب حقيقة أن 
مبادرة مستودعات البيانات الخاصة به قد تمّ دمجُها مع مشروع تكامل أوسع. وكان 
النهج الذي اتبعوه هو توحيد الأدوات ووَضْع إطار عمل مع أول علامتين تجاريتين هكن 
تطبيقهما على الطرح التدريجي لبقية المنظمة. 

في البداية كانوا بحاجة إلى التوحيد القياسي على أداة .811 وتطوير منهجية جديدة 
وطريقة الاستفادة من .8:11. وقد استخدموا أداة :8:11 كأداة تحويJ (Extract ELT)‏ 
للتنزيل والحفاظ على تكامل بيانات المعاملات المعقدة. وقد انتهي هذا التاجرٌ إلى 
ELT àlal elazz ob 4 4o05JI ETL à 55 ETL jL iss “Informatica Lgs)‏ 
كمُحرك للبيانات وجدولة المهمة فقط. 

ثانياً بالإضافة إلى تخزين بيانات المعاملات الدقيقة؛ فقد استطاع تاجر التجزئة 
الاستفادة من منصّة تيراداتا لتنفيذ جميع تحويلات الأعمال في قاعدة البيانات عند 
نقل البيانات إلى بيئة إعداد التقارير. وقد سمح لهم هذا النهج بالاحتفاظ بنسخة من 
المعاملات الدقيقة» والاستفادة من عمليات التكامل خارج ا مربع المتوفرة في تحليلات 
تيراداتا لحلول 547؟ بغرض إضافة سياق إلى بيانات 547: وتسخير قوة قواعد البيانات 
لتطبيق التحويلات والتحليلات الأخرى. 

ثالثا كان أمرٌ الحصول على بيانات عالية الجودة أمرًا ضروريًا بالنسبة لهم. كما أنهم 
يريدون التأكّد من أن البيانات يُمكن الوصول إليها وإدارتها على نحو مُتسق. وتوضّح 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yos‏ 


الفصل الثالث 


الأرقام المادية أهمية إدارة البيانات بالنسبة إلى هذا التاجر. وقد تمَّ تنظيمٌ أرقام المواد 
بشكل مختلفٍ عبر أنظمة متعددة. وكان من الممكن توفيقها خلال عملية التنزيل/ 
gssai‏ وقد مكّنهم هذا الهيكل الجديد من lali‏ على التحَدَّي الذي واجههم 
بسهولة من خلال إنشاء طرق عَرّْض المواد الفريدة في مستودع البيانات لتنسيق الأرقام 
المادية لإعداد التقارير. 

df als‏ فقد كان الأمرُ يتطلّبُ طريقةً ذكيةًٌ لتقديم البيانات التحليلية والوصول 
للتقارير ا متخصصة. والتي يمكنها أيضًا أن تلبّي المتطلبات المتنوعة للعلامة التجارية. 


ومن خلال الاستفادة من شراكات تيراداتا مع G‏ الحلول مثل “MicroStrategy‏ 
فقد تمكّن هذا التاجرٌ من الوصول إلى البيانات الدقيقة المخرّة في مستودع البيانات في 
أثناء استخدام أدوات ذكاء الأعمال لتطبيق الخوارزميات المناسبة, والاستفادة من المرونة 
المُصمّمة في حَلّ مستودع البيانات. 

وفي البداية؛ كان تطويرٌ مستودع البيانات باعتباره محوراً مركزبا للوصول إلى 
البيانات؛ أمرًا صعبًا بسبب الحاجة إلى تطوير إطار عمل جديد ومنحنى elsi‏ العام 
بسبب التغيير في أسلوب تصميم مستودع البيانات. ولحُسْن الحَظْ؛ فإنه بمجرد تطوير 
هذا الإطارء كان التكامل باستخدام برنامج تحليلات تيراداتا لحلول 547 بسيطًا وقابلا 
للتكرار. ووفقاً لرؤية مخطط المشروع لدى متاجر التجزئة الأوروبية: «يُحَد برنامج 
تحليلات تيراداتا لحلول 547 حلاً متكاملاً وسريعاً ومرناً كما أنه يحقق تنميةً أسرع» 
ويقلل نسبة ا مخاطرة, بالإضافة إلى كونه نموذجاً دلاليًا متكاملاً. ويوفر الوصول المباشر 
إلى البيانات التفصيلية». 

الدروس المستفادة: 

وبوجه عام؛ فإن هدف تاجر التجزئة هو توفير إستراتيجية تنفيذ قابلة للتكرار؛ 
من خلال العلامات التجارية الخاصة بالشركة؛ وذلك من أجل تمكين أفضل القرارات في 
العمل؛ إضافةً إلى تحسين كفاءة الأعمال» وخفض تكاليف التشغيل من خلال مركزية 
تقنية المعلومات. وعلى الرغم من أنهم ما زالوا في المراحل الأولى من المشروع؛ فإنهم قد 
تعلّموا من تنفيذ عملية دمج علامتهم التجارية الأولى في مستودع بيانات تيراداتا. ونظرًا 
لاستخدام صاحب الشركة لبرنامج تحليلات تيراداتا لحلول 547؟ فقد تمكَّنوا من تسريع 
وقت تقييم أنشطة التكامل وتبسيطها. إضافةً إلى تمكنهم من تطوير بعض الفوائد 
التالية لتطبيقها على دَمْج علاماتهم التجارية اللاحقة والمشاريع المماثلة. 


n.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (7): ذكاء الأعمال ومستودعات البيانات 


وتتمثل هذه الفوائد فيما يلي: 

aae‏ الوقت الكافي في العناية الواجبة والتعرّف على التقنيات/ الحلول المتوفرة 
لدعم عمليات التنفيذ. وفي هذه الحالة تمكن صاحب الشركة من الاستفادة من برنامج 
تحليلات تيراداتا لحلول 547؟ مما أدى إلى تقليل وقت التقييم وتمكينه من التركيز على 
التحليلات بدلًا من التكامل. 

- تطوير إطار عمل لتمكين العمليات المتكرّرة التي يمكن أن تعالج تعقيدات الكمية 
الهائلة من البيانات والاحتياجات المخصّصة للأعمال. 

- الجفاظ قدر الإمكان على بساطة تصميم النظام؛ لضمان اعتماد التقنية والنشاط التجاري. 

- التأكّد من توافق القرارات الفنية مع الرؤية الشاملة لتمكين سرعة الأعمال التجارية. 

- تطوير نهج قياسيّ لإدارة البيانات؛ لضمان سلامة البيانات التي تمتدٌ إلى ما بعد 
عملية التنفيذ؛ بحيث يفهم مستخدمو الأعمال والمستخدمون الفنيون كيفية تطبيق 
البيانات للتقارير والتحليلات. 

- تحديد مهلة للتأخير؛ لضمان وَضْع حلول -لكلٌ من مستودعات البيانات والتكامل- تدعم 
الاحتياجات. مما يعني ضمان أنَّ Teradata SAP Í>‏ يدعم أيضًا احتياجاتهم التشغيلية. 

وتُطبّق هذه الدروس المستفادة للتنفيذ على نطاق أوسع. واستخدام برنامج 
تحليلات تيراداتا لحلول 548. وقد التزم صاحبُ الشركة بمركزية بنيته التحتية وإدارة 
علاماته التجارية بشكل أكثر فعالية. مما أذَى إلى الاستفادة من هذه الطريقة لجعل 
العملية تتم بطريقة أوتوماتيكية مع تقليل الوقت اللازم لإتمامها؛ بسبب القدرة على 
J> clus‏ مُسِتَهدّف لربط حلول تخطيط موارد المؤسسات لتحليلاتهم. 

أسئلة للمناقشة: 

-١‏ ما هي bial‏ التي واجهتها متاجرٌ التجزئة الهولندية الكبيرة؟ 

dodi sa la -Y‏ المقترح متعدد الأطراف؟ وما هي التحَدَّيات التي واجهت التنفيذ؟ 

*- ما هي الدروس المستفادة؟ 


Source: Teradata case study. (2015). 800 percent: Use of Teradata* Analytics for 
SAP* Solutions accelerates Big Data delivery. assets.teradata.com/resourceCenter/ 


downloads/CaseStudies/EB8559 TAS Case Study.pdf?processed-1 (accessed July 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


"Ww 


الفصل الثالث 


2016); Enterprise Management, Teradata-SAP Solution to Big Data analytics. www. 
enterprisemanagement.com/research/asset.php/3047800-/Percent:-Use-of- Teradata- 
Analytics-for-SAP-Solutions-Accelerates- Big-Data-Delivery (accessed July 2016). 


ومن الواضح أن تحديدَ هدف العملء واجتماع المستخدمين النهائيين للإدارة على EES‏ 
المشروع, بالإضافة إلى تحديد الأَطْر الزمنية والميزانيات المعقولة:» وإدارة التوقعات» كلها أمورٌ 
بالغة الأهمية لنجاح مشروع مستودعات البيانات؛ إذ إنَّ إستراتيجية مستودعات البيانات هي 
مخطط للتطبيق الناجح في إدخال مستودع البيانات. ويجب أن تقوم هذه الإستراتيجية بِوَضْف 
الأهداف التي تسعى الشركة إلى تحقيقهاء ويماذا تريدٌ تحقيق هذه الأهدافء وماذا ستفعل عندما 
تحقق هذه الأهداف. كما ينبغي أن تضع في اعتبارها رؤية المنظمة وهيكلها وثقافتها. ولمعرفة 
الخطوات التي يمكن أن تساعد في وَضْع إستراتيجية مرنة Matney,) Je g3bNI LSe dJls8s‏ 
3. عند وَضْع خطة ودعم مستودع البيانات؛ فإن المؤسسة تحتاج إلى بحث مُورّدي مستودع 
البيانات» (راجع الجدول ٠-۲‏ للحصول على قائمة عينات من المورّدينء ويمكنك أيضًا مراجعة معهد 
مستودعات البيانات [801.018]] وبناة المعلومات eig LS .([informationbuilders.com]‏ 
العديد من المورّدين برامج تجريبية للمستودعات البيانات الخاصة بهم ومنتجات ذكاء الأعمال. 


جدول "-7: قائمة عيّنات لمورّدي مستودعات البيانات 


بائع عروض ال منتجات 


مجموعة شاملة من برمجيات ذكاء الأعمال وبرامح 

e (businessobjects.com) Jl.eNI cb5ls 
(SAPI Él تصوير البيانات (المملوكة‎ 

مجموعة شاملة من أدوات ومنتجات مستودع 

(DW) البيانات‎ 


(cai.com) cuul2JI «5,5 


مرآة (datamirror.com) cL.‏ قسم. وإدارة» وثمرة أداء 10107 


مجموعة مزايا (dataadvantagegroup.com) SLLJI‏ برنامج البيانات الوصفية 











DW خوادم‎ Dell (dell.com) 
2117 أداء‎ à قسم» وإدارةء ومر‎ Embarcadero (embarcadero.com) cUias 
مزود حلول البيانات» وموفر حلول البيانات (مملوك‎ 
Greenplum (greenplum.com) 
(EMC الآن من قبل‎ 
(CRM) ثمرة وخدمات إدارة علاقات العملاء‎ Harte-Hanks (harte-hanks.com) 


yw‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
































التحليلات الوصفية (؟): ذكاء الأعمال ومستودعات البيانات 


بائع عروض المنتجات 
HP (hp.com)‏ خوادم DW‏ 
Hummingbird Ltd. (hummingbird.com)‏ محركات 1011 ومستودعات الاستكشاف 
ES Hyperion (hyperion.com) Jsl-‏ جحاكلة SE Ng‏ وتطبيعات 
BM InfoSphere. (www-O0l.ibm.com/software/‏ 1 | تكامل البيانات» و٥0٧‏ وإدارة البيانات الرئيسيةء 
olas | data/infosphere)‏ البيانات الكبيرة 











DW .lal à 549 «lal s «eub Informatica (informatica.com) 
DW olaug أدوات‎ (microsoft.com) C gwg Kls 

برنامج وموفر الأجهزة 0W‏ (أجهزة )0W‏ (مملوكة 
(IMB 35,3) o Netezza‏ 
(Siebel: oracle.comg PeopleSoft :Jaż59) Oracle‏ أدوات CRM; ERP5 DW clus cles‏ 
معهد SAS (sas.com)‏ أدوات ومنتجات وتطبيقات DW‏ 
Siemens (siemens.com)‏ خوادم DW‏ 
Sybase (sybase.com)‏ مجموعة شاملة من أدوات وتطبيقات DW‏ 
(Teradata.com) lal;‏ أدوات 2117, وأجهزة 2117, واستشارات وتطبيقات 72117 


مناهج تطوير مستودع البيانات: 
تحتاج العديدُ من المؤسسات إلى إنشاء مستودعات البيانات المُستخدّمة لدعم القرارء وهناك 

نهجان يستخدمان في هذا الغرضء وهما: 

- النهج الأول: وهو نَمْجِ ذكاء الأعمال 13202 11 والذي يُطلّق عليه «أب Olesguua (Father)‏ 
البيانات»؛ إذ يؤيد 181202 نهج التطوير من أعلى إلى أسفل والذي يتكيّف مع أدوات قاعدة 
البيانات التقليدية الارتباطية؛ وذلك لتلبية احتياجات تطوير مستودع البيانات على مستوى 
المؤسسة. ويُعرّف lájf gail lio‏ باسم EDW gy‏ 

- النهج الثاني: gë! gül Ralph Kimball g4 s‏ نهجًا تصاعديًا من القاعدة إلى القمة؛ إذ 
يستخدم نمذجة الأبعاد. ويُعرف هذا النهج أيضًا باسم نهج DM‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري nr‏ 












































الفصل الثالث 


إِنَّ معرفة أوجه التشابه والاختلاف بين هذين النهجين يساعدنا على قَهُم مفاهيم مستودع 
البيانات الأساسية (وللمزيد انظر: 2004 ,«:اوه8). وفیما يلي جدول ۳-۳ والذي يقارن بين 
هذين النهجينء ويقدّم وصمًا تفصيليًا لهما: 


جدول ۳-۳: التباین بین نهجي التطویر 01 و۷٥۴‏ 


الإطار 

وقت التطوير 
تكلفة التطوير 
صعوبة التطوير 


المتطلبات المسبقة لتبادل 
البيانات 

المصادر 

الأحجام 

أفق زمني 

تحويلات البيانات 

تحديث التردد 

التقنية 


المعدات 


نظام التشغيز 
قواعد البيانات 


الاستعمال 





عدد المستخدمين المتزامنين 


yat 





نھچ DM‏ 
ا لمجال موضوع واحد 


شهور 
٠‏ دولار إلى ٠٠١٠٠١‏ دولار 


منخفضة إلى متوسطة 

عام (داخل منطقة العمل) 

فقط بعض الأنظمة التشغيلية والخارجية 
ميجابايتس إلى عدة جيجابايتس 

بالقرب من البيانات الحالية والتاريخية 


منخفض إلى متوسط 


aes eL. JS‏ أسبوعيًا 


محطات العمل والخوادم والإدارات 
ويندوز ولينكس 
مجموعة العمل أو خوادم قاعدة البيانات 


القياسية 


105 





EDW i 


المجالات عدة مواضيع 





عام (عبر المؤسسة) 

العديد من الأنظمة التشغيلية والخارجية 
جيجابايتس إلى بيتابايتس 

البيانات التاريخية 

متوسط 


esl‏ شهريًا 


خوادم المؤسسة وأجهزة الحاسب المركزية 


يونيكس: 05/390 ,2/05 


خوادم قواعد بيانات المؤسسة 





من 1005 إلى 10005 


ذكاء الآعمال والتحليلات وعلم البيانات» منظور إداري 


















































التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 














الجهود DM gë‏ نهج EDW‏ 
أنواع المستخدمين محللي منطقة الأعمال والمديرين محللي الشركات وكبار المديرين التنفيذين 
إلقاء الضوء على الأعمال تحسين الأنشطة داخل مجال الأعمال |التحسين الانسيابي واتخاذ القرارات 


المصادر: مقتبس من (2003) .[ den ٥۷6,‏ «ة۷. بيانات المخططات: خطة كبيرةء وبناء صغير. كتيب في إدارة JS‏ 

.CRC Press. Ariyachandra, T., & Watson, H.2 :Iديlرl‎ «gتlر الطبعة الثامنة« بوكا‎ 

- نموذج 12/8107 (طريقة 852117): ويركّز نهج 1٣٥١‏ على التطوير من القمة إلى القاعدة 
باستخدام منهجيات وأدوات تطوير قاعدة بيانات ثابتةء مثل: الرسوم البيانية للعلاقات بين 
(ERD) SLLSI‏ وتعديل نهج التطوير الحلزوني. ولا هنع نهج 8210 إنشاء .DMs‏ وَيُعَلٌ 
NW‏ نظاماً مثاليًا في هذا النهج؛ لأنه يوفر وجهة نظر متسقة وشاملة للمؤسسةء وقد قدم 
(1998) 11116322 إطار عمل لتطوير 17آ581(0. 

- موذج 8411 :K1M‏ إن موذج إستراتيجية Kimball J DM‏ هو «خطةٌ $5.5 وبناء صغير». و 
6 هو مستودع البيانات الموجّهة بالموضوع أو الموجّهة بحسب القسم. فهو نسخة مُصغّرة 
من مستودع البيانات الذي يركز على طلبات قسم معينء مثل: التسويق أو المبيعات. ويطبّق 
هذا النموذج نمذجة بيانات الأبعاد. والتي تبدأ بالجداول. وقد دعا الط إلى منهجية 
تطوير تستلزم اتباع نهج تصاعديّ (من القاعدة إلى القمة)» وهو ما يعني في حالة مخازن 
البيانات بناء 1221 واحد في كلّ مرة. 


ما هو النموذج الأفضل؟ 

لا تُوجَد إستراتيجية واحدة تناسب الجميع لمستودعات البيانات. فمن الممكن أن تتطوّر 
إستراتيجية تخزين بيانات المؤسسة من 1081 بسيط إلى مستودع بيانات مُعقّد استجابة لمطالب 
المستخدمين» ومتطلبات أعمال المؤسسة. ونضج المؤسسة في إدارة موارد البيانات الخاصة بها. 
وبالنسبة للعديد من الشركات؛ فإن نموذج 121 في كثيرٍ من الأحيان هو خطوة أولى مريحة 
لاكتساب الخبرة في بناء وإدارة مستودع بيانات في أثناء عرض مُستخدمي الأعمال بالإضافة إلى 
فوائد الوصول بطريقة أفضل إلى بياناتهم. وتشير علامة 2114 عادةً إلى قيمة الأعمال الخاصة 
ب؟مستودعات البيانات. وفي النهاية؛ تُعَذ هندسة 812117 والتي تدمج 1215 القديمة ومستودعات 
البيانات هي الحل المثالي (انظر: الحالة العملية .)-١‏ ومع ذلك؛ فإنَّ تطوير نماذج 12815 الفردية 
يمكنها أن توفر فوائد عديدة في طريقها نحو تطوير EDW‏ خاصة إذا كانت المؤسسة غير قادرة 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1o‏ 














الفصل الثالث 


أو ليس لديها رغبة في الاستثمار في مشروع على نطاق واسع. كما يمكن أن تظهر دلائل جدوى 
ونجاح نموذج 2215 في تقديم المزايا. وقد يؤدي ذلك إلى استثمار في 82717. ويُلخّص الجدول 
5-8 أهمّ الاختلافات المميزة بين النموذجين. 


جدول -: الفروق الأساسية بين Kimball Inmon (s‏ 


الصفة المميّزة 
النهج العام 
هيكل البناء 
تعقد الأسلوب 
مقارنة مع منهجيات 
التنمية القائمة 
مناقشة التصميم المادي 
اتجاه البيانات 
الأدوات 


إمكانية وصول المستخدم النهائي 


الجمهور الرئيسي 
الموقع في المؤسسة 





1 





Inmon 
المنهجية وأسلوب البناء‎ 
من أعلى إلى أسفل (تنازلي)‎ 


مستودع بيانات «يغذي» قواعد 
البيانات الإدارية على مستوى المؤسسة 


مشتقة من المنهجية الحلزونية 


ls Xe dI ids 
نمذجة البيانات‎ 
موضوع» أو بيانات مستندة‎ 


تقليدية (رسوم بيانية لعلاقة الكيان 
[ERD]‏ ورسوم بيانية لتدفق البيانات 


([BDF] 

الفلسفة 
مُتخصّصو تقنية المعلومات 
جزءٌ لا يتجزأ من قاعدة معلومات الشركات 





Kimball 


من أسفل إلى أعلى (تصاعدي) 


نموذج 21815 عملية تجارية واحدق 
ويتحقق الاتساق المؤسسي؛ من خلال 
ناقل البيانات ومطابقة الأبعاد 


بسيطة إلى حَذٌ كبير 


عملية من أربع خطوات؛ خروجًا عن 
أساليب RDBMS‏ 


عملية موجهة 


نمذجة الأبعاد. خروجًا عن النمذجة 
العلائقية 


متوسط 


المستخدمون النهائيون 
محوّل وخادم البيانات التشغيلية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


















































التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


الصفة المميّزة Kimball Inmon‏ 
تقديم died do‏ على المستخدمين النهائيين 
الاستعلام عن البيانات بشكلٍ مباشر 
والحصول عليها في أوقات استجابة معقولة 


Sources: Adapted from Breslin, M. (2004, Winter). Data warehousing battle of the giants: Comparing the 


L6 eaa‏ تقني سليم يعتمدٌ على 


الموضو 3 x‏ 
أساليب وتقنيات قاعدة البيانات المجرّبة 











basics of Kimball and Inmon models. Business Intelligence Journal, 9(1), 6-20; Ariyachandra, T., & Watson, 
H. (2006b). Which data warehouse architecture is most successful? Business Intelligence Journal, 11(1). 


اعتبارات إضافية لتطوير مستودع البيانات: 

تريد بعص المنظمات الاستعانة بمصادر خارجية بالكامل في جهود مستودعات البيانات؟ إذ إنهم 
لا يريدون اقتناء البرمجيات والأجهزة. كما أنهم لا يريدون التعامل مع إدارة نظم المعلومات الخاصة 
بهم» وليس لديهم سوى بديل واحد وهو استخدام مستودعات البيانات المستضافة. وفي هذه الحالة؛ 
فإن الحل المثالي هو قيام شركة أخرى لديها الكثيرٌ من الخبرة والمهارة بتطوير مستودع البيانات 
والحفاظ عليه. غير أنَّ هناك مخاوف تتعلق بالأمان والخصوصية مع استخدام هذا النهج (وللحصول 
على المزيد من التفاصيل راجع الرؤية الفنية .)١-7‏ 


تمثيل البيانات في مستودع البيانات: 

يُظهر هيكلٌ مستودع البيانات النموذجي في الشكل 6-8 إمكانية إجراء العديد من أشكال 
بنية مستودع البيانات (انظر: (A-Y JSA‏ وبغضٌ النظر عن البنية الهندسية؛ فقد كان تصميمُ 
تمثيل البيانات في مستودع البيانات يعتمدٌ دائنًا على مفهوم النمذجة البعدية. وتُعرّف النمذجة 
البعدية كنظام قائم على الاسترجاع يدعم وصول طلبات البحث ذات الحجم الكبير. ويجبٌ أن 
يتم تصميمٌ وتمثيل البيانات في مستودع ولكن أيضًا تعزّز معالجة الاستفسارات المعقدة المتعددة 
الأبعاد. وفي كثير من الأحيان؛ فإنَّ مخطط النجمة ومخطط 500171216 هما الوسيلة التي يتم 
بها تنفيدٌ النمذجة البعدية في:مستودعات البيانات. 

يُعَدُ مخططٌ النجوم (ويُشار إليه أحيانًا بااسم مخطط الانضمام إلى النجوم) أبسط وأكثرَ أماط 
نمذجة الأبعاد استخدامًا. ويحتوي مخطط النجوم على جدول حقائق مركزي مُحاط بعدَّة جداول 
أبعاد ومتصلّ بها (2009 ,72502ة44). ويحتوي جدول الحقائق على عدد كبير من الصفوف التي 
تتوافق مع الحقائق المرئية والروابط الخارجية (أيْ: مفاتيح خارجية). ويحتوي جدول الحقائق 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري nw‏ 














الفصل الثالث 


على السّمات الوصفية اللازمة لإجراء تحليل القرار وإعداد تقارير الاستعلام» ويتمٌ استخدام المفاتيح 
الخارجية للارتباط بجداول الأبعاد. وتتكوّن سمات تحليل القرار من مقاييس الأداءء» والمقاييس 
التشغيلية» والمقاييس المجمّعة (مثل: حجم المبيعات, OY zig‏ الاحتفاظ بالعملاء. وهوامش الرّبح» 
وتكاليف الإنتاج؛ ومعدّل الخردة) وجميع المقاييس الأخرى اللازمة لتحليل أداء المنظمة. وبعبارة 
ÓL ssi‏ جدول الحقائق يتناول بشكلٍ أساسيّ ما يدعم مستودع البيانات لتحليل القرارات. 

إِنَّ جداول الحقائق المركزية المحيطة (والمرتبطة عبر المفاتيح الخارجية) هي جداول الأبعاد. 
وتحتوي جداول الأبعاد على تصنيف وتجميع المعلومات حول صفوف الحقائق المركزية. كما 
تحتوي على السّمات التي OLLI A‏ ا موجودة داخل جدول الحقائق» وتتناول كيفية تحليل 
البيانات وتلخيصها. وإضافةً إلى ذلك؛ فإنها تحتوي أيضًَا على علاقة واحد - إلى - مُتعدّد في جدول 
الحقائق المركزية» وعند استخدام الاستعلام يتم استخدامٌ الأبعاد لوضع القيم العددية في شرائح 
من 5-١‏ في جدول الحقائق لتلبية الاحتياجات المتعلّقة بالمعلومات. وقد تمّ تصميمٌ المخطط 
النجمي؛ بهدف توفير وقت الاستعلام والحصول على استجابة سريعة؛ إضافةً إلى بساطته وسهولة 
صيانة هياكل قاعدة بيانات القراءة فقط. ويوضّح الشكل 88-١٠مخططاً‏ نجمياً بسيطاً وَيُعَلٌ 
المخطط النجمي حالةً خاصةً لمخطط مجموعة (Snowflake) ell‏ 

وبالنسبة لمخطط مجموعة الثلج (52019131)؟ فهو عبارة عن ترتيب منطقي للجداول في قاعدة 
بيانات مُتعدّدة الأبعاد؛ بحيث يشبه المخطط الارتباطي مجموعة الثلج في الشكلء ويرتبط مخطط 
مجموعة الثلج (500:1316) ارتباطًا وثيقا بالمخطط النجمي عن طريق جداول حقائق مركزية 
(تكون واحدة فقط عادةً) والتي ترتبط بأبعاد متعددة. ومع ذلك ففي مخطط مجموعة الثلج 
os 5 ez (Snowflake)‏ الأبعاد إلى عدة جداول مرتبطة ببعضهاء في حين يتم تقوية أبعاد مخطط 
النجمة. مع تمثيل كلّ بُعْد بجدول واحد. ويظهر مخطط مجموعة ثلج بسيط في الشكل .٠١-07‏ 










































































شكل :٠١-"‏ (2) مخطط النجمة. و() مخطط كتلة الثلج 


YTA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 







































































التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


رؤية فنية :١-۴‏ مستودعات البيانات الْستصَافة 

يحتوي مستودع البيانات المستضاف على نفس الوظيفة» إن لم يكن أكثر؛ فهو يعمل كمستودع 
بيانات في الموقع: غير أنه لا يستهلك موارد الحاسب في أماكن عمل العميل. ويُّقدّم مستودع 
البيانات المستضاف مزايا ذكاء الأعمال مطروحًا منها تكلفة تحديثات الحاسبء وتحديثات 
الشبكة: وتراخيص البرامج والتطوير الداخلي والدعم الداخلي والصيانة. 

ويْقدّم مستودع البيانات المستضاف المزايا التالية: 
- يتطلَّب الحَدَّ الأدنى من الاستثمار في البنية التحتية. 
- يُحرّر القدرة على الأنظمة الداخلية. 
- يُحرّر التدفق النقدي. 
- يُقدّم حلولاً قوية بأسعار معقولة. 
- كن الحلول القوية التي تساعد على النمو. 
- يُقدّم مُعَذَّات وبرامج ذات جودة أفضل. 
- يوفّر اتصالات أسرع. 
- تمكّن ا مستخدمين من الوصول إلى البيانات من المواقع البعيدة. 
- يسمح للشركة بالتركيز على الأعمال الأساسية. 
- يفي باحتياجات التخزين لأحجام كبيرة من البيانات. 

وعلى الرغم من مُميّزات مستودع البيانات المستضاف؛ فإنَّ ذلك لا يستلزم أن يكون مناسبًا 
SU‏ منظمة. فبعض الشركات الكبيرة التي تتجاوز عائداتها 0٠١‏ مليون دولار قد تخسر الأموال إذا 
كان لديها بالفعل بنيةٌ تحتيةٌ داخلية وموظفون في مجال تقنية المعلومات. وعلاوةً على ذلك؛ فإن 
الشركات التي ترى أن التحؤل النموذجي يحدث عن طريق الاستعانة بمصادر خارجية في تطبيقات 
فقدان السيطرة على التحكّم في البيانات الخاصة بهم لا تفضل استخدام مُقدّم خدمة ذكاء الأعمال. 
gaio‏ فإن أكثر الحجج شيوعًا والتي تعيق تطبيق مستودع البيانات ا مستضافةء هو أنه قد يكون 
من غير الحكمة الاستعانة مصادر خارجية للتطبيقات الحساسة لأسباب تتعلق بالأمان والخصوصية. 


تحليل البيانات في مستودع البيانات: 


بمجرد تخزين البیانات بشکل مناسب في مستودعات البیانات؛ كن استخدامها بطرق 
مختلفة لدعم القرارات التنظيمية. ويُكن القول بأن تقنية 014۴ هي تقنية تحليل البيانات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري va‏ 


الفصل الثالث 


الأكثر استخدامًا في مستودعات البيانات: وقد تزايد الإقبال على هذه التقنية؛ بسبب الزيادة 
الهائلة في حجم البيانات والاعتراف بالأعمال القيّمة للتحليلات المبنية على البيانات. وببساطة؛ 
فإن 0142© هو نهج للإجابة بسرعة عن الأسئلة المخصّصة عن طريق تنفيذ استفسارات تحليلية 
متعدّدة الأبعاد ضد مستودعات البيانات التنظيمية (أي: مستودعات البيانات» و012/15). 


:OLTP Jläs OLAP 


يُستَخدّم مصطلح 01:55 (وهو نظام معالجة المعاملات عبر الإنترنت) في نظام المعاملات 
المسئول بشكل أساسيّ عن التقاط وتخزين البيانات المتعلّقة بوظائف العمل اليومية. مثل: ERP‏ 
SCM3 «CRM‏ و8 وغيرها. ويتعامل نظام 01:18 مع احتياجات الأعمال الحساسة: وأداء 
معاملات الأعمال اليومية بطريقة أوتوماتيكية. وتشغيل التقارير فوريًّه والتحليل الروتيني. غير 
أنَّ هذه الأنظمة ليست مُصمّمة للتحليل المُخمّص والاستفسارات المعقدة التي تتعامل مع عدد 
من عناصر البيانات. ومن ناحية أخرى؛ فقد تمّ تصميمٌ 01.42 لمعالجة هذه الحاجة؛ من خلال 
توفير تحليلٍ مُخصَّصٍ للبيانات التنظيمية بشكل أكثر فعاليةً وكفاءةً. ويعتمد كل من OLAP‏ 5 
01:17 بشكلٍ كبير على بعضهما؛ إذ يستخدم 05.68 البيانات التي تم التقاطها بواسطة 01:18: 
ويقوم 01:58 آليّا باجراء عمليات الأعمال التي تتم إدارتها بواسطة القرارات التي يدعمها 
هرآه. ويقدّم الجدول 0-Y‏ مقارنةً متعددة plell‏ بین 011۲ وطهآ0. 


جدول 0-8: مقارنة بین 011۶ و01۸۴ 


OLAP OLTP wll 


s‏ 3 لدَغم صُنْع القرار وتقديم إجابات 
osa‏ للقيام مهام العمل اليومية 0 an‏ 
قاعدة بيانات المعاملات (مستودع | مستودع البيانات أو (مستودع 
مصدر البيانات |بيانات عادي يركز بشكل أساسي على | بيانات غير طبيعي يركز في المقام الأول 
الكفاءة والاتساق) 1 على الدقة والاكتمال) 

تقارير واستعلامات مُخصّصة ومتعددة 
الأبعاد ومركزة على نطاق واسع 
المعالجات. وقواعد البيانات اللتخصّصة 
ذات السّعة الكبيرة 


التقارير تقارير دورية» وروتينية ومركزة بدقة 


متطلبات المصدر | قواعد البيانات المترابطة (العلائقية) العادية 














vv.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


OLAP OLTP ا معايير‎ 


سريع (تسجيل المعاملات التجارية | بطيء (موارد مكثفة؛ ومعقدة. 
والتقارير الروتينية) واستعلامات واسعة النطاق) 











عمليات 01.42: 
يعتمد الهيكل التشغيلي الرئيسي في 01.47 على مفهوم يُسمَّى المكعب. والمكعب في 
۶ هو عبارة عن بنية بيانات متعددة الأبعاد (فعلية أو افتراضية) والتي تسمح بتحليلٍ 
سريع للبيانات» كما يكن تعريف المكعب بأنه القدرة على معالجة البيانات وتحليلها A‏ 
من وجهات نظر مُتعدّدة ويهدف ترتيب البيانات في مكعبات إلى cla‏ على القصور في قواعد 
البيانات المترابطة (العلائقية)؛ إذ إِنَّ قواعد البيانات (المترابطة) العلائقية لا تناسب التحليل 
الفوري لكميات كبيرة من البيانات بشكل جيد؛ بل إنها بدلا من ذلك تتيح الفرصة للتلاعب 
بالسّجلات (من خلال إضافة وحذف وتحديث البيانات) والتي تمثل سلسلةٌ من ا معاملات. وعلى 
الرغم من وجود العديد من أدوات كتابة التقارير لقواعد البيانات العلائقية؛ فإنَّ هذه الأدوات 
تكون بطيئة عند تنفيذ استعلام متعدد الأبعاد يشمل العديد من جداول قاعدة البيانات. 
OLAP elaixzabs‏ 55 للمحلّل التنقل عبر قاعدة البيانات والشاشة لمجموعة فرعية مُعيّنة 
من البيانات (وتطويرها بمرور الوقت) عن طريق تغيير اتجاهات البيانات وتعريف العمليات 
Aus Ao aad‏ هذه الأنواع من التنقلات التي يقوم i‏ المستخدم من خلال تحديد شرائح (عن 
طريق التناوب) والتنقل لأسفل/ لأعلى (عبر التجميع والتصنيف) أحيانًا ب «شريحة ونرد» وتتضمّن 
عمليات 01.48 الشائعة الاستخدام شريحةً ونردا والتنقيب لأسفلء ولفة المتابعة والمحور. 
- الشريحة: هي عبارة عن مجموعة فرعية من صفيف مُتعدّد الأبعاد (وعادةً تمثيل ثناني الأبعاد), 
هذه المجموعة تطابق قيمةً واحدةً لبعد واحد (أو أكثر) من الأبعاد غير الموجودة في المجموعة 
الفرعية. ويبين يبَيّن الشكل ١١-1‏ عملية تشريح بسيطة على مكعب ثلافي الأبعاد. 
- حجر الترد: SIE‏ هي عبارة عن شريحة على أكثر من بُعدّين من مكعب البيانات. 
- التنقل لأسفل/ لأعلى: التنقل لأسفل أو لأعلى هو تقنية 01,47 مُحدَّدة؛ إذ يتنقل المستخدم بين 
مستويات البيانات التي تتراوح من الأكثر إيجارًا (أعلى) إلى الأكثر تفصيلًا (أسفل). 
- لفة المتابعة: يتضمَّن اللف إلى الأعلى حساب جميع علاقات البيانات لواحد أو أكثر من الأبعاد. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yvi‏ 











الفصل الثالث 


وللقيام بذلك؛ قد يتم تعريف علاقة حسابية أو صيغة. 
- المحور: ويُستَخدّم لتغيير اتجاه الأبعاد لتقرير أو عرض صفحة الاستعلام المخصّص. 


مكعب pus! LSSGOLAP‏ 
يعمليات تشريحاتقطيع 




















شكل :1١-8‏ عمليات تقطيع على مكعب بيانات بسيط ثلائي الأبعاد 


أسئلة مراجعة على القسم *-5: 

-١‏ اذكر فوائد مستودعات البيانات. 

؟- اذكر عِدَّة معايير لاختيار بائع مستودع البيانات: واذكر سبب أهميتها. 
*- ما هو 01.42؟ وكيف يختلف عن SOLTP‏ 

Salg ما هو المكعب؟ وماذا يعني التنقل لأسفل» واللف» والشريحة»‎ -٤ 


۷-۳ قضايا تنفيذ عملية مستودعات البيانات: 
إِنَّ عملية مستودعات البيانات las ele JS à‏ جهدًا هائلًا يجب التخطيط له وتنفيذه 
وفقاً للأساليب المتّبعة. غير أنَّ دورة حياة المشروع لها عِذَّة جوانب ولا يمكن لأيٌّ شخصٍ أن يكون 


vvv‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 

















التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


خبيا في كل ا مجالات. ولذلك فنحن هنا بصَدّد مناقشة أفكار وقضايا مُحدّدة لها صلة بعملية 
مستودعات البيانات. 

يرغبٌُ الناس في معرفة مدى نجاح مبادرات ذكاء الأعمال ومخازن البيانات الخاصة بهم مقارنةً 
بمبادرات الشركات الأخرى. وقد اقترح (Iv « -3) Watsons Ariyachandra ja ds‏ بعض معايير نجاح 
ذكاء الأعمال ونشاط مستودعات البيانات. كما قام «Gonzalezs .Gerard s Watson (ya js‏ 3 
4 و(1999) 760102 بالبحث في حالات فشل مستودع البيانات. وقد أظهرت نتائجهم 
ose vlil ój‏ «الفشل» بطرق مختلفةء وهذا ما أگده Watson) s Ariyachandra ja JS‏ 
12006( وقد قام معهدٌ مستودعات البيانات (10191.018) بتطوير نموذج متكاملٍ لمستودعات 
البيانات تستطيع المؤسسة تطبيقه لقياس مدى تطورها. ويقدّم النموذج وسيل سريعة لقياس 
مدى صلاحية مكان مستودعات البيانات الخاصة با منظمة في الوقت الحالي؛ وكذلك الأماكن التي 
تحتاجٌ إلى الانتقال إليها فيما بعد. ويتكوّن نموذجُ النضج من ست مراحل» وهي: مرحلة ما قبل 
الولادةء الرضاعةء الطفولة: المراهقة: البلوغ, الحكمة. 

وترتفع قيمةٌ الأعمال مع تقدُم مستودع البيانات خلال JS‏ مرحلة من مراحل النجاح. ويتمُ تحديدٌ 
المراحل من خلال عدد من الخصائص» ها في ذلك النطاق» والهيكل التحليليء والتصؤرات التنفيذيةء وأنواع 
التحليلات» والإشراف» والتمويل» وبرنامج التقنية» وإدارة التغييرء والإدارةء ولمزِيدٍ من التفاصيل انظر: 
-Eckerson (2003)5 «Watson(2009)g «Twogoodg «McGiverng «Hackathorng «Eckerson‏ 


تتسمٌ مشاريعٌ مستودع البيانات بالعديد من المخاطر. كما أنَّ معظم هذه المخاطر موجودةٌ 
أيضًا في مشاريع تقنية المعلومات الأخرى؛ ولكن مخاطر مستودعات البيانات أكثر خطورة؛ لأن 
مستودعات البيانات غالية الثمن وتتطلب الكثير من الوقت والموارد. ومشاريع واسعة النطاق. 
لذلك؛ فإن التطوير الناجح لمستودع البيانات يتطلّب تقييم كلّ خطر في بداية المشروع. ومن 
امهم التفكير بعناية في مختلف المخاطرء وتجنّب المشكلات التالية: 
- الخطأ في اختيار الرّعاة: فأنت بحاجة إلى راع تنفيذيّ 4 5535 على الموارد الضرورية لدعم واستثمار 
مخزن البيانات. كما أنك تحتاج أيضًا إلى قائد تنفيذيّ للمشروع؛ ولا بُدَّ أن يكون هذا القائد شخصًا 
اكتسب احترام المسؤولين التنفيذيين الآخرين: ولديه شكوكٌ مقبولةٌ حول التقنية كما أنه لا بُذّ أن 
يتصف بِالحَرْم مع المرونة. وإضافةً إلى ذلك؛ bl‏ أيصًا تحتاج إلى مدير 15/1١‏ ليرأس اممشروع. 
- تحديد توقعات يَصعّب الوفاء بها: cal‏ لا تريد إحباط المديرين التنفيذيين بإخبارهم بحقائق 
معينة. کل مشروع من مشاريع مستودعات البيانات يتكوّن من مرحلتين: 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري VY‏ 


الفصل الثالث 


- المرحلة الأولى: هي مرحلة البيع؛ إذ تقوم بتسويق المشروع داخليًا عن طريق بيع الفوائد 
مَنْ يستطيعون الوصول إلى الموارد المطلوبة. 
- المرحلة الثانية: وتتمثل في الاجتهاد؛ من أجل الوفاء بتوقعات المرحلة الأولى» فبمجرد أن 
يكون لديك ما بين ١‏ و/ ملايين دولار؛ فإننا نأمل أن تتمكّن من تحقيق ذلك. 

- الانخراط في اتباع نهج سلوي غير جيد: ببساطة لا تقل بأن مستودعات البيانات ستساعد 
المديرين في اتخاذ قرارات أفضل؛ لأن ذلك ضمنياً يعني أن قراراتهم السّابقة غير جيدة حتى 
الآن. ولكن قم بالترويج لفكرة أنهم سيكونون قادرين على الحصول على المعلومات التي 
يحتاجونها للمساعدة في صُنْع القرار. 

- تحميل الُستودّع بالمعلؤمات جرد توفرها: لا تجعل مستودع البيانات مُكبًا للبيانات؛ لأن 
هذا من شأنه أن يُبطئ استخدام النظام بغير داع. وهناك اتجاةً نحو الإحصاء والتحليل بشكلٍ 
فوري. ويجب إغلاق مستودعات البيانات في الوقت المناسب. 

- الاعتقاد أن تصميم قاعدة بيانات؛ من أجل مستودعات البيانات هو نفس تصميم قاعدة 
بيانات المعاملات: وبشكل عام؛ فإنه ليس كذلك. فالهدف من مستودعات البيانات هو 
الوصول إلى ا مجاميع بدلا من السجلات الفردية أو القليلة: كما هو الحال في أنظمة معالجة 
المعاملات. ويختلف المحتوى أيضًا كما هو واضح في كيفية تنظيم البيانات؛ إذ ميل نُظم 
إدارة قواعد البيانات (08345) إلى أن تكون غير مفرطةء وطبيعيةء ومترابطة» في حين تكون 
مستودعات البيانات زائدة عن الحاجة: وليست طبيعية: ومُتعدّدة الأبعاد. 

- اختيار مدير مستودع البيانات» والذي يكون مُوجها للتقنية بدلا من المستخدم: يتمثل أحد 
مفاتيح نجاح مستودع البيانات قي فهم ضرورة حصول المستخدمين على احتياجاتهم» وليس 
التقنية المتقدّمة من أجل التقنية. 

- التركيرٌ على البيانات الداخلية التقليدية الموجّهة للسجلء وتجاهل قيمة البيانات الخارجية 
والنصوص والصورء ورها الصوت والفيديو: تأتي البيانات بأشكال عديدةء ويجب أن تكون متاحة 
للأشخاص ال مناسبين في الوقت ال مناسب وبالشكل الصحيح. ويب أن يتم فهرستها بشكلٍ صحيح. 

- تقديم البيانات باستخدام تعريفات متداخلة ومذهلة: jsi‏ تطه ير البيانات جانبًا مهمًا من 
مستودعات البيانات. ويشمل التوفيق بين تعريفات وتنسيقات البيانات المتعارضة على 
مستوى المنظمة» غير أنَّ ذلك قد يكون صعبًا من الناحية السياسية؛ نظرًا لأنه ينطوي عادةً على 
تغيير المستوى التنفيذي. 


yve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


- الإهانٌ بالقدرة على الوفاء بوعود الأداء» والقدرة والقابلية للتطوير: تتطلّب مستودعات البيانات 
بشكلٍ عام سعةً وسرعةً أكبر مما هو مرصود في الميزانية. أيْ: التخطيط للمستقبل على نطاق واسع. 
- الاعتقاد أنَّ المشكلات قد انتهت عندما يكون مستودع البيانات جاهرًا: إذ تحتاج مشاريع /81 
5 إلى التطوير بشكل مستمر. فكل نَشْر هو تكرار لعملية النماذج الأوّلية. وسيكون هناك 
حاجةٌ دائمَةٌ لإضافة المزيد من مجموعات البيانات المختلفة إلى مستودع البيانات؛ إضافة إلى أدوات 
تحليلية إضافية للمجموعات الموجودة والإضافية من صُنَّاعَ القران كما يجب تخطيط الطاقة العالية 
والميزانيات السنوية؛ لأن النجاح يُولّد lolo‏ فبناء مستودعات البيانات عملية مستمرة. 
- التكيز على التنقيب في البيانات المخصّصة» وتقديم التقارير الدورية بدلًا من التنبيهات: إن 
التطؤر الطبيعي للمعلومات في مستودع البيانات هو: )١(‏ التنقيب في البيانات من الأنظمة 
القدهةء وتطهيرهاء وتغذية المستودع بهاء (1) دَعْم التقارير المخصّصة حتى يمكنك التعرّف على 
مايريده الناس. (*) تحويل التقارير المخصّصة إلى تقارير مجدولة بانتظام. وهذه العملية 
المتمثلة في معرفة ما يريده الناس من أجل توفيره تبدو طبيعية؛ لكنها ليست الأمثل أو حتى 
عملية. فالمديرون مشغولون وهم في حاجة إلى الوقت لقراءة التقارير؛ ولذلك فإن أنظمة 
التنبيه أفضل من أنظمة التقارير الدورية» وتمكنها أن تجعل مهمة مستودع البيانات حاسمةً. 
وتقوم أنظمة التنبيه بمراقبة تدفق البيانات إلى المستودع وإبلاغ جميع الأشخاص الرئيسيين 
الذين يحتاجون إلى معرفة أيّ حَدَّتْ مهم فور وقوعه. 
في العديد من المؤسسات» لن يكون مستودع البيانات ناجحًا إلا إذا كان هناك دَعْمٌ قوي 
من الإدارة العليا من أجل تطويره. وإذا كان هناك بطل للمشروع ارتقى إلى أعلى في الهيكل 
التنظيمي. فعلى الرغم من أنَّ هذا الأمر من المحتمل أن يكون صحيحًا في Sl‏ مشروع كبير لتقنية 
المعلومات؛ فإنه مهم بشكل خاص لتنفيذ مستودع البيانات. إذ يؤدي التنفيذ الناجح ممستودع 
البيانات إلى إنشاء هيكل إطار عمل قد يسمح بتحليل القرارات في جميع أنحاء المؤسسة» وفي 
بعض الحالات يوفر أيضًا 5024 شاملاً؛ وذلك من خلال منح الوصول إلى المعلومات الخاصة 
بعملاء ومورّدي المنظمة. وقد سهّل تنفيذٌ مستودعات البيانات المستندة إلى الويب (والتي تُسِمّى 
أحيانًا عهزةناهطدء187) الوصول إلى كميات هائلة من البيانات» ولكن من الصعب تحديد الفوائد 
الثابتة المرتبطة بمستودع البيانات. إذ يتم تعريف الفوائد الثابتة على أنها منافع للمنظمة التي 
يمكن التعبيرٌ عنها من الناحية النقدية. ويُوجَّد لدى العديد من المنظمات موارد محدودة لتقنية 
المعلومات غير أن الأولوية يجب أن تُعطى للمشاريع. وقد يساعد الدعم الإداري والبطل القوي 
للمشروع في ضمان أن يتلقى مشروع مستودع البيانات الموارد اللازمة للتنفيذ الناجح. كما أن موارد 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yvo‏ 


الفصل الثالث 


مستودع البيانات قد تكون مكلفةً بشكلٍ كبيرء وفي بعض الحالات تتطلب معالجات عالية الجودة 
وزيادات كبيرة في أجهزة تخزين الوضول اللباشر. وقد تحتوي مستودغات:البيانات اللسغندة إلى 
الويب أيضًا على متطلبات أمان خاصة؛ لضمان وصول المستخدمين المصرّح لهم فقط إلى البيانات. 

d aedi all dS) Lia d‏ تطوير البيانات ونماذج الوصول عاملا حاسكًا في نجاح تطوير 
مستودع البيانات؛ إذ إنه في أثناء نمذجة البيانات يكون عامل الخبرة مهما لتحديد البيانات 
المطلوبة: وتحديد قواعد العمل المرتبطة بالبيانات؛ إضافةً إلى تحديد المجموعات والحسابات 
الأخرى التي قد تكون ضروريةً. وهناك حاجة لنمذجة الوصول لتحديد كيفية استرجاع البيانات 
من مستودع البيانات» كما أنها تساعدٌ ف التعريف المادي للمستودع من خلال اللمساعدة في 
تحديد البيانات التي تتطلب فهرسة. وقد تشير أيضًا إلى ما إذا كانت ء0۷ التابعة مطلوبة 
لتسهيل استرجاع المعلومات. وإضافةً إلى ذلك؛ فإن هناك حاجة إلى مهارات فريق لتطوير وتنفيذ 
مستودع البيانات. بما في ذلك المعرفة المتعمّقة لتقنية قواعد البيانات وأدوات التطوير امُستَخدّمة. 
وتشيرٌ أنظمة المصدر وتقنية التطوير - كما سبق أن ذكرنا - إلى العديد من المدخلات والعمليات 
المُستخدّمة لتنزيل وصيانة مستودع البيانات. وتمثل الحالة العملية 5-٠‏ مثالًا ممتارًا على تطبيق 
واسع النطاق لمستودع بيانات متكامل من قبل حكومة الولاية. 


حالة عملية ٤-٣‏ 
۷W‏ يساعد على رَبّط وكالات الدولة في ولاية ميشغان 

تؤثر إذارة هع 2111 للتقنية والإدارة والميزانية (171318) على كلّ مجالٍ من 
مجالات الحكومة؛ من خلال خدمة العملاءء وتحسين cala b!‏ والاستخدام المبتكر 
للمعلومات والتقنية» ويعتمد ما يقرب من ٠٠٠٠١‏ مستخدم في 0 أقسام رئيسة Yeg‏ 
وكالة وأكثر من ٠٠١‏ مكتب على 810117 للقيام بمهامّهم بشكلٍ أكثر فاعلية وخدمة أفضل 
للمقيمين à‏ ههوندك211. ويحقق 8211 مليون دولار في »" عمل في الفوائد المالية. 

وقد ساعد 81117 ميشيغان في تحقيق فوائد مالية سنوية بقيمة ٠٠١‏ مليون دولار 
ضمن قسم صحة المجتمع وَخْده؛ إضافةً إلى 1/0 مليون دولار أخرى في السنة ضمن دائرة 
الخدمات الإنسانية (2115). وتشمل هذه المدخرات فوائد سلامة البرنامج» وتفادي 
التكاليف؛ بسبب تحسّن النتائج» وتجنب العقوبات؛ والكفاءة التشغيليةء واسترداد 
المدفوعات غير الملائمة ضمن lp lI Medicaid gly‏ ويوفّر مستودع البيانات 
5 في (2117) ههونطء11 معلومات فريدة ومبتكرة حاسمة لعمل الوكالة بكفاءة 


لقف ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (7): ذكاء الأعمال ومستودعات البيانات 

من ا مستوى الإستراتيجي والتكتيي. فعلى مدى السنوات العشر الماضية حققت شركة 
217 نسبة فعالية التكلفة 1:10: وشُسهم المعلومات الموحّدة من 2117 الآن في جميع 
وظائف Gi DHS‏ ما في ذلك التسليم الدقيق والمحاسبة للفوائد المقدَّمة مما يقرب 
من ۲,۵ مليون عميل من موظفي الدَّعم العام. 

Michigan ils‏ طموحة في محاولاتها لحَلّ مشكلات الحياة الحقيقية من خلال 
المشاركة المبتكرة والتحليلات الشاملة للبيانات؛ إذ كان نهجها تجاه 81/211 داتمًا 
«مشروعًا» (على مستوى الولاية) بطبيعته» بدلا من وجود منصات منفصلة من BI/‏ 
JS) DW‏ منطقة عمل أو وكالة حكومية. وقد استفادت «هعنطء¡N‏ من كميات هائلة 
من البيانات لإنشاء أساليب مبتكرة لاستخدام 81/0۷ وتقديم حلول مؤسسية تتسمُ 
بالكفاءة والمصدّاقية باستخدام قنوات متعددة؛ وذلك من خلال إزالة الحواجز التي 
تحول دون مشاركة بيانات المؤسسات عبر وحدات الأعمال. 

أسئلة للمناقشة: 

ISU -١‏ تستثمر الدولة في بنية أساسية كبيرة ومُكلّفة لتقنية المعلومات (مثل 1812117)؟ 

-Y‏ ما هو حجم وتعقيد 810117 امُستَخدّمة من قبل وكالات الدولة في ولاية صهعندء3/]1؟ 


3EDW الحصول عليها من‎ e المقترح والنتائج التي‎ Jla ما هى التحَدّيات‎ -" 
Sources: Compiled from TDWI Best Practices Awards 2012 Winner, Enterprise 
Data Warehousing, Government and Non-Profit Category. Michigan Departments 
of Technology, Management & Budget (DTMB), Community Health (DCH), and 
Human Services (DHS). TDWI What Works, 34, 22; michigan.michigan.gov. 


مستودعات البيانات الضخمة وقابلية التطوير: 

يحتاج مستودعٌ البيانات إلى دَعْم قابلية التوسّع بالإضافة إلى المرونة» وتتمثل القضايا الرئيسية 
المتعلقة بقابلية التطوير فيما يلي: مقدار البيانات ال موجودة في المستودع ومدى سرعة نمو 
مستودع التخزين» وعدد المستخدمين المتزامنين» وتعقيد طلبات المستخدمين» كما يجب أن يتسع 
مستودعٌ البيانات أفقيًا وعموديًا. وسوف ينمو المستودعٌ كدالة لنمو البيانات والحاجة إلى توسيع 
المستودع لدعم وظائف الأعمال الجديدة. وقد يكون نمو البيانات ناتجًا عن إضافة بيانات الدورة 
الحالية (على سبيل المثال: نتائج هذا الشهر) أو البيانات السابقة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري VV‏ 


الفصل الثالث 


وقد وَصَف هيكس )٠٠١١(‏ قواعد البيانات الضخمة ومخازن البيانات. وتقوم Walmart‏ 
باستمرار بزيادة حجم مستودع البيانات الضخم الخاص بها. ومن المعتقد أن Walmart‏ تستخدم 
مستودعًا terabytes ga Glia e ggi‏ من البيانات لدراسة اتجاهات المبيعات, وتتبّع المخزون» 
وتنفيذ مهامٌ أخرى. وقد قامت 1811 مؤخرًا بنشر مؤشرها الخاص بالمستودع الذي يبلغ 6٠‏ 
تيرابايت (1831:2009). الجديرٌ بالذكر أن وزارة الدفاع الأمريكية تستخدم مستودعًا للبيانات 
يبلغ 0 بيتابايت لحفظ السجلات الطبية لعدد ‏ ملايين من الأقراد العسكريين. كما CNN Ql‏ 
أيضًا لديها مستودع بيانات بحجم Usg Petabyte‏ نظرًا للتخزين المطلوب لأرشفة لقطات الأخبار. 

وبالنظر إلى أنَّ حجم مستودعات البيانات يتوسّع بمعدل أُنّي؛ فإن القابلية للتطوير هي قضية 
مهمة. ويُقصّد بقابلية التوشع الجيد أن الاستعلامات ووظائف الوصول إلى البيانات الأخرى 
ستنمو (بشكلٍ مثالي) خطيًا مع حجم المستودع. انظر: (2006) 120560618 للتعرّف على طرق 
تحسين أداء الاستعلام. وفي الممارسة العملية تمّ تطويرٌ أساليب مُتخصّصة لإنشاء مستودعات 
بيانات قابلة للتطويرء غير أنَّ قابلية التوشع صعبة عند إدارة مئات ASİ gf terabytes‏ فبيانات 
JI de ggio terabytes oxu‏ كبيرٍ من القصور الذاتي» sis‏ الكثير من المساحة المادية, 
كما أنها تتطلّب أجهزة حاسب قوية. وتستخدم بعض الشركات المعالجة المتوازية لإدارة بياناتهم, 
في حين يستخدم البعض الآخر الفهرسة الذكية وخطط البحث. كما يقوم البعض بنشر بياناتهم 
عبر مخازن البيانات الفعلية المختلفة. ومع اقتراب المزيد من مستودعات البيانات من حجم 
]هم يستمرٌ تطوير حلول أفضل وأحسن لقابلية التوسع. 

وقد عالج (2002) 11دقة أيضًا قضايا قابلية التطوير وتُعَلُ شركة :418:1 شركةً رائدةً في مجال 
نشر واستخدام مستودعات البيانات الضخمة: وقد استطاعت ۸18١‏ اكتشاف الاحتيالية لاستخدام 
بطاقات الاتصال والتحقيق في المكالمات المتعلقة بعمليات الخطف والجرائم الأخرى؛ وذلك بفضل 
مستودع البيانات الذي تبلغ سعته 1" تيرابايت. كما أنها استخدمت القدرة على حساب ملايين 
أصوات الاتصال من مشاهدي التلفزيون الذين يختارون بطل ,2 dal American Idol e‏ 
وللحصول على عيّنة من تطبيقات مستودعات البيانات الناجحة, „Edwards (2003) : „hsl‏ 339 
درس ءاسا[ و(2004) عههآ الاتجاهات والقضايا المُحدَّدة المتعلقة باستخدام الموارد الخارجية في 
تطوير ودَعْم مستودعات البيانات وتطبيقات ذكاء الأعمال» ol di Davison (2003) jai US‏ 
الاستعانة مصادر خارجية في مجال تقنية المعلومات كانت تتزايد بمعدل ٠١‏ إلى 70* سنوياء وعند 
النظر في نقل مشاريع مستودعات البيانات إلى الخارج؛ يجب النظر بعناية إلى الثقافة والأمن 
(وطمزيد من التفاصيل انظر: 2004 -Jukic & Lang,‏ 


YVA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


أسئلة مراجعة على القسم *-لا: 

-١‏ ما هي مهام تنفيذ 19117 الرئيسية التي يمكن تنفيذها بالتوازي؟ 

۲- اذكر مع الشرح المبادئ التوجيهية الأكثر دقة في تنفيذ 21/17. 

۴- ما هي أهمٌ المخاطر والقضايا التي يجب مراعاتهاء ورها تجنبها عند تطوير مستودع بيانات ناجح؟ 
-٤‏ ما هي القابلية للتطوير؟ وكيف تطبّق على 2117؟ 


۸-۳ إدارة مستودع البيانات» والمشكلات الأمنيةء والاتجاهات المستقبلية: 
توفُر مستودعات البيانات $55 تنافسيةًٌ متميزةً للمؤسسات التي تنش ئها وتستخدمها 
بفاعلية. ونظرًا لحجمها الكبير وطبيعتها الجوهرية؛ فإنَّ مستودع البيانات يتطلب مراقبةً قويةٌ 
بشكلٍ خاصٌ؛ للحفاظ على كل من الكفاءة والإنتاجية المرضيتين. وتنطوي الإدارة الناجحة وإدارة 
مستودع البيانات على ا مهارات والكفاءة التي تتجاوز ما هو مطلوب من مسؤول قاعدة البيانات 
التقليدي (284). ويجب أن يكون مسؤول مستودع البيانات (0۷4) متوافقاً مع تقنيات 
البرامج العالية الأداء والأجهزة والشبكات. كما يجب أيضًَا أن يمتلك رؤية أعمال رائعة. وما 
كانت مستودعات البيانات تغذّي أنظمة ذكاء الأعمال و2755 والتي تساعد المديرين في اتخاذ 
قرارتهم» وَجَبَ على مسؤول مستودع البيانات أن يكون على دراية بعمليات اتخاذ القرار لتصميم 
هيكل مستودع البيانات وصيانته بشكلٍ مناسب. ومن المهمّ بشكل خاص أن يحافظ 121174 على 
المتطلبات والإمكانات الحالية لمستودع البيانات؛ في حين يوفر في الوقت نفسه مرونةً للتحسينات 
السريعة. وأخيرَاه يجب أن تمتلك 11174 مهارات اتصال ممتازة. وللحصول على وَصْف للاختلافات 
الأساسية بين James (2000) .Fadlallas .-Benanders .Benander : il .DWA 5 DBA‏ 
is‏ أمان المعلومات وخصوصيتها من الاهتمامات الرئيسة والمهمة بالنسبة لمُستخدمي مستودع 
البيانات. وقد أصدرت الحكومة الأمريكية لوائح (على سبيل المثال: قواعد الخصوصية والضمان ل 
Gramm-Leach-Bliley‏ والتأمين الصحي وقانون المساءلة لعام 1195 [811244]). ووضعت 
متطلباتٍ إلزاميةً في إدارة معلومات العملاء. وبالتالي؛ يجب على الشركات إنشاء إجراءات أمنية فعَّالة؛ 
ولكنها مرنة في الوقت ذاته لتتوافق مع العديد من أنظمة الخصوصية. ووفقًا لما ذكره كل Elson ġa‏ 
و(2005) ع0165».]؛ فإنه يجب أن يركز الأمان الفعَّال في مستودع البيانات على أربعة مجالات رئيسية: 
-١‏ وَضْعَ سياسات وإجراءات أمنية فعّالة للشركات. ويجب أن تبدأ السياسة الأمنية الفعّالة من 
الإدارة التنفيذية العلياء وينبغي إبلاغٌ جميع الأفراد داخل ا مؤسسة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yya‏ 


الفصل الثالث 


'- تنفيذ إجراءات وتقنيات أمنية منطقية لتقييد الوصول. وتتضمّن هذه الإجراءات التحقق من 
المستخدم: وعناصر التحكم في الوصولء وتقنية التشفير. 
"- تقييد حرية الوصول إلى محيط مركز البيانات. 
ع- إنشاء عملية مراجعة فعّالة للرّقابة الداخلية مع التركيز على الأمن والخصوصية. 
وسوف يتم تحديدٌ تطورات مستودعات البيانات على المدى القريب؛ وذلك من خلال عوامل 
ملحوظة (مثل: حجم البيانات» وزيادة درجة التأهب لوقت الاستجابة» وتنوع وتعقيد أنواع 
البيانات) وعوامل أخرى أقل وضوحًا (مثل: متطلبات المستخدم النهائي التي لم تستوف البيانات» 
وبطاقات الأداء المتوازن» وإدارة البيانات الرئيسية: وجودة المعلومات). وفي ضوءٍ هذه العوامل 
İAgosta (2006) ş Moseley (2009) ə JS gzl äs;‏ تعتمد اتجاهات مستودعات 
البيانات على البساطة. والقيمة, والأداء. 


مستقبل مستودعات البيانات: 

لقد كان مجالٌ مستودعات البيانات مجالا حيويًا في مجال تقنية المعلومات في العقدين 
الأخيرينء وتبرهن الأدلة في عام 81/84 والبيانات الضخمة أن أهمية المجال سوف تزداد فقط 
حتى تصبح أكثر إثارةً للاهتمام. وفيما يلي بعض المفاهيم والتقنيات التي ظهرت مؤخرًا والتي 
ستلعب دورًا مهما في تحديد مستقبل مستودعات البيانات. 


الاستعانة بمصادر مختلفة (آليات للحصول على البيانات من مصادر متنوعة ومتفرقة): 

- شبكة الإنترنت» ووسائل التواصل الاجتماعيء والبيانات الضخمة: إن الطفرة الأخيرة في استخدام 
شبكة الإنترنت لأغراض شخصية إضافةً إلى الأعمال التجارية: إلى جانب الاهتمام الكبير بوسائل 
التواصل الاجتماعي يوفر inil Lb‏ للاستفادة من مصادر بيانات غنية جدًا. وبسبب 
الحجم الهائل والسرعة وتنؤٌع البيانات؛ فقد ظهر مصطلحٌ جديدٌ لتسمية هذه الظاهرة» وهو 
مصطلح: «البيانات الضخمة». وللاستفادة من البيانات الضفخمة؛ فإن الأمر يتطلب تطوير 
تقنيات 81/84 الجديدة والمحسَّنة؛ مما سيؤدي إلى ثورة في عالم مستودعات البيانات. 


Sources: Compiled from Thornton, M., & Lampa, M. (2002). Hosted data warehouse. Journal of Data 
Warehousing, 7(2), 27-34; Thornton, M. (2002, March 18). What about security? The most common, but 
unwarranted, objection to hosted data warehouses. DM Review, 12(3), 30-43. 


Y^‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


- برمجيات مفتوحة المصدر: يتزايدٌ استخدام أدوات البرمجيات مفتوحة المصدر إلى مستوى 
غير مسبوق في التخزينء وذكاء الأعمالء وتكامل البيانات. وهناك أسباب وجيهة للزيادة في 
البرمجيات المفتوحة المصدر المُستخدّمة في مستودعات البيانات )2009 igp5 (Russom,‏ 
-١‏ أذَى الركود إلى زيادة الاهتمام بالبرامج المفتوحة المصدر المنخفضة التكلفة. 
؟- وصلت الأدوات مفتوحة المصدر إلى مستوى أعلى في النضج. 
"- تقوم البرمجيات مفتوحة ا مصدر بتقوية برامج المشاريع التقليدية دون استبدالها. 

- 5985 (كخدمة برمجية). «نموذج 45 الموسّع»: تُعَدُ 5035 طريقةً مبتكرةً لنشر 
تطبيقات أنظمة المعلومات؛ إذ يقوم مُوفّر الخدمة مَنْح العملاء ترخيصاً لاستخدام 
تطبيقاته عند الطلب لاستخدام تطبيقاته كخدمة عند الطلب (وعادةً ما يكون ذلك عبر 
الإنترنت). Ehh Ss‏ برامج 5885 استضافة التطبيق على الخوادم الخاصة بهم أو 
تنزيل التطبيق إلى موقع المستهلك. والمضمون أن 5885 هي النسخة الجديدة والمحسّنة 
من نموذج 457. وبالنسبة لعملاء مستودع البيانات؛ فإن العثور على تطبيقات وموارد 
البرمجيات القانمة على 848 والتي تلبُّي الاحتياجات والمتطلبات الخاصة من ال ممكن 
أن يكون أمرًا صعبًا. ونظرًا لأن عروض هذه البرامج أصبحت أكثر مرونةً؛ فإن الاستعانة 
ب 5885 والاستخدام الفعلي لها كخيار ممنصّة مستودعات البيانات سوف يزداد أيضًا. 

- حوسبة سحابية: رما تكون الحوسبة السّحابية هي الخيارٌ الأحدث والأكثر إبداعًا في النظام 
الأساسي الذي سيأتي على مدار سنوات؛ إذ يتم تجميعٌ العديد من موارد الأجهزة والبرمجيات 
الافتراضية؛ بحيث يمكن تخصيصها بحرية للتطبيقات ومنصات البرامج عند الحاجة إلى الموارد. 
مما يتيح لتطبيقات أنظمة ا معلومات أن ترتفع ديناميكيًا مع زيادة أعباء العمل. وعلى الرغم 
من أن تقنيات الحوسبة السحابية والتقنيات الظاهرية المشابهة معروفة جيدًا للتطبيقات 
التشغيلية اليوم؛ فإنها بدأت الآن في استخدامها كبرامج مستودع بيانات مختارة. فالتخصيص 
الفعّال للسَّحابة يكون مفيداً بشكلٍ خاص عندما يختلف حجم مستودع البيانات بشكلٍ غير 
متوقع؛ مما يجعل تخطيط السّعة أمرًا صعبًاء 

- بحيرات البيانات: مع ظهور البيانات الضخمة ظهر برنامج بيانات جديد يُسمَّى: بحيرة البيانات» 
وهو عبارة عن موقع تخزين كبير يمكنه الاحتفاظ بكميات هائلة من البيانات (والتي غالبًا ما 
تكون غير مهيكلة) في تَسَقها الأصلي/ الخام لاستهلاك التحليلات المستقبلية/ المحتملة. فبينما 
يقوم مستودع البيانات مستودعات البيانات المنظمة؛ فإن بحيرة البيانات تخزّن جميع أنواع 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YNY‏ 


الفصل الثالث 


البيانات. في حين أن كليهما عبارة عن آليات لمستودعات البيانات؛ فمستودع البيانات يتمحور 
حول البيانات المنظمة/ المجدولة» أما بحيرة البيانات تناسب جميع أنواع البيانات. وعلى الرغم 
من كثرة ما قيل وكتب عن العلاقة بين الاثنين (بعض هذه الكتابات» وبعض ما قيل يوحي بأن 
بحيرة البيانات» هي الاسم المستقبلي لمستودعات البيانات)؛ فإنَّ بحيرة البيانات ليست بديلا 
لمستودع البيانات؛ بل يُكمّلٍ كلّ منهما الآخر. وفيما يلي الفكرة التطبيقية ١-٠‏ والتي نرگز من 
خلالها على شرح بحيرات البيانات ودورها في مجال مستودعات البيانات والتحليلات التجارية. 


رؤية فنية ۲-۳: بحيرات البيانات: 

مع ظهور ظاهرة البيانات الكبيرة؛ ظهر مصطلحٌ جديدٌ وهو «بحيرة البيانات». ويعتقد 
الكثيرون أن بحيرة البيانات هي نفسها مستودع البيانات القديم؛ ولكن بشرط أن يكون 
جيدًا. ويشير الافتراض الأساسي إلى أن الطريقة القديمة لمستودعات البيانات لا تناسب 
(أولا تكفي) في عصر البيانات الكبيرة» وبالتالي؛ فإن هناك حاجةً إلى طريقة جديدة لتخزين/ إدارة 
البيانات؛ مما همد الطريق لبحيرات البيانات. وعلى الرغم من أن معظمهم يعتقدون أن بحيرة 
البيانات هي الطريقة المُثلىء وأنها جاهزة لعمل قفزة كبيرة في مجال مستودعات البيانات؛ فإِنَّ 
البعض الآخر له تحفُظات على استخدامها Ši leys)‏ في جدواها). واصفاً إياها بأنها مستنقع. 


S)‏ ما هى حقيقة بحيرة البيانات؟ 

ól‏ بحيرة البيانات ببساطة هي موقعٌ تخزين كبير يمكنه الاحتفاظ بكميات هائلة من البيانات 
(مهيكلة أو غير مهيكلة أو شبه مهيكلة) بتنسيقها الأصلي/ الخام للاستخدام المستقباي ا محتمل. في 
حين أن مستودع البيانات لا يُخرّن إلا البيانات المنظمة في الجداول أو الملفات أو ا مجلدات» كما أن 
بحيرة البيانات تستخدم بنيةً غير مُحدَّدة المعالم GI)‏ غير مهيكلة) لتخزين جميع أنواع البيانات. 
مستودعات البيانات» وعلى العكس؛ فإن الاختلاف الرئيسي هو أن مستودع البيانات يِتعَلّق بالبيانات 
ا منظمة / المجدولة» في حين أن بحيرة البيانات تتعلق بجميع أنواع البيانات (مثل: البيانات الكبيرة). 

على الرّغم من أن تعريف بحيرة البيانات يتغيّر بين علماء البيانات؛ فإِنّ التعريف الأكثر 
استخدامًا هو James Dixon Asy‏ مؤسس شرکة ۲۲,۲41٥‏ و010 والذي ارتبط اسمه 
بمصطلح بحيرة البيانات. وفيما يلي الطريقة التي يّصف بها (2010 ,ده:ذ) بحيرة البيانات؛ 
إذ يقول: إذا كنت تفكر في سوق البيانات كمخزن للمياه المعبأة - من حيث تنظيفها وتعبئتها 


YAY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


وتنظيمها لسهولة الاستهلاك - فإنَّ بحيرة البيانات عبارة عن مجموعة كبيرة من ال مياه في حالة 
طبيعية» وتدفق إليها المحتويات من أحد المصادر لملء البحيرة» وفي هذه الحالة يمكن لمستخدمي 
البحيرة المتنوعين أن يفحصوهاء أو يغوصوا فيهاء أو حتى يأخذوا عينات منها. 
ولعلّ أفضل طريقة لتوصيف بحيرة البيانات؛ هي مقارنتها بمستودع بيانات في جدول مُتعدّد 
الأبعاد. وفيما يلي الجدول (-1) وهو عبارة عن جدول ملخص (يتبعه وصفّ مُوجَر) للأبعاد الأكثر 
شيوعًا لعمل مقارنة بين بحيرة البيانات ومستودع البيانات (2015 (Dull, 2016; Cam pbel!,‏ 
جدول "-1: مقارنة بسيطة بين مستودع البيانات وبحيرة البيانات 
Ax‏ مستودع البيانات بحيرة البيانات 

طبيعة البيانات منظمة ومعالجة أي بيانات أصلية / أولية 
المعالجة مُخطط على الكتابة (:5©1) 
سرعة الاسترجاع سريع جداً 
حجم التكلفة مكلفة للبيانات الكبيرة 
المرونة أقل isa‏ والتكوين ثابت 
الحداثة/ الخبرة ليس جديداً/ ناضج 


الأمان مُأمّن بطريقة جيدة 














الستخدمون مُحترفو الأعمال علماء البيانات 


طبيعة البيانات: يقوم مستودع البيانات بمستودعات البيانات التي تم تصميمها/ تجميعها/ 
هيكلتها فقط؛ في حين أنَّ بحيرة البيانات تقوم بتخزين كافة أنواع البيانات المهيكلة, وشبه 
المهيكلة؛ إضافةً إلى غير المهيكلة بتنسيقها الأصلي/ الأوّلي. 

المعالجة: قبل تنزيل البيانات في مستودع البيانات؛ نحتاجٌ أولًا إلى إعطائها شكلا وهيكآد 
أيْ: إننا نحتاج إلى وَضّْع نموذج لها في المخطط النّجمِي أو مخطط مجموعة quil‏ وهو ما يُسِمَى 
مخطط الكتابة. GÍ‏ مع بحيرة البيانات؟ فإننا نقوم فقط بتنزيل البيانات الأولية» كما هيء وعندما 
نكون مستعدين لاستخدام البيانات؛ فإننا نعطيها شكلًا أو تصميمًاء وهو ما يُطْلّق عليه مخطط 
القراءة. وهما طريقتان مختلفتان للغاية في المعالجة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YAY‏ 








الفصل الثالث 


سرعة الاسترجاع: لأكثر من عقدين وهناك تطويرٌ مستمرٌ للعديد من القواعد الحسابية 
لتحسين سرعة استرجاع البيانات من مستودعات البيانات التي تتميّز بأنها مليئة وكبيرة. وتشمل 
هذه التقنيات المشغلات, والتمثيل العمودي للبيانات» ومعالجة قواعد البيانات. وحتى ÓL OI‏ 
عملية استرجاع البيانات (التي يمن أن تكون بأيّ شكلٍ آو أسلوب» ها في ذلك النص غير المنظم) 
i AS ss clas bas i‏ 

تكلفة التخزين: Gi ça Hadoop Jis pS) OLLI lais id OTI gaal iS‏ 
تكلفة مستودعات البيانات منخفضة نسبيًا مقارنةٌ مستودع البيانات» وهناك سببان رئيسان لذلك: 
- السبب الأول: 512000 وهو برنامجٌ مفتوح المصدر؛ ولذلك فإن الترخيص ودَعْم المجتمع مجاني. 
- السبب الثاني: أنه تمّ تصميمٌ Čuo Hadoop‏ يتم تثبيته على أجهزة السّلع المنخفضة التكلفة. 

المرونة: بالتعريف يُعَدُّ مستودع البيانات مستودعًا منظمًا للغاية. وليس من الصعب تقنيًا 
تغيير بنيته؛ ولكن قد يستغرق هذا الأمرُ وقنًا طويلًا؛ نظرًا لجميع العمليات التجارية المرتبطة به. 
ومن ناحية أخرى؛ فإِنَّ بحيرة البيانات تفتقرٌ إلى بنية مستودع البيانات؛ مما يعطي علماء البيانات 
والمُطوّرين القدرة على تهيئة نماذجهم وطلباتهم وتطبيقاتهم بسرعة وإعادة تشكيلها. 

الحداثة/ الخبرة: كانت التقنيات المتوفرة في مستودع البيانات موجودةً منذ فترة طويلة. 
ومعظم الابتكارات التي حدثت تم إنجازها في العشرين إلى الثلاثين عامًا الأخيرة. ولذلك فإنه لا 
يُوجَّد تحديث في مستودعات البيانات» وإن وُحِدَّ فهو قليلٌ جدًا (مع استبعاد التقنية اللازمة لتعبئة 
واستخدام «البيانات الكبيرة» داخل مستودع البيانات). وعلى الجائب الآخر؛ فإِنَّ بحيرات البيانات 
جديدة» وتتقدم من خلال الابتكار والحداثة لتصبح هي التقنية السائدة لمستودعات البيانات. 

الأمان: نظراً لوجود تقنيات مستودع البيانات منذ عقود طويلة؛ فإِنَّ القدرة على تأمين البيانات 
في مستودع البيانات أكبر بكثير منها في بحيرة البيانات. ومع ذلك؛ فإنه تجدر الإشارة إلى الجهد 
الكبير الذي يُبذْل الآن في مجال الأمان في صناعة البيانات الضخمة. ولا يتعلق الأمرٌ بما إذا كان أمن 
بحيرات البيانات سوف يُلبّي متطلبات محترفي التحليلات وغيرهم من المستخدمين النهائيين» أم لا. 

المستخدمون: لقد كان شعار العالّم التحليلي لفترة طويلة؛ هو «تحليل وفهم الأعمال 
للجميع». وقد أنشأنا مستودع البيانات ووجّهنا الدعوة للجميع لاستخدامه؛ ولكن هل استخدموه 
بالفعل؟ والإجابة هي أن نسبة مَنْ استخدموه لا تتعَدّى *70-٠١‏ فقط. هل بحيرة البيانات هي 
نفس صيحة مستودع البيانات؟ هل سنقوم بإنشاء بحيرة البيانات وندعو الجميع إلى استخدامها؟ 


AE‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


رما يحدث ذلك في المستقبل. أمّا في الوقت الحالي؛ فإن بحيرة البيانات بوضعها الحاليء ومرحلة 
النضج التي وصلت إليها Xa‏ هي الأنسب لعلماء البيانات. 
وباختصار؛ فإن بحيرة البيانات تختلف عن مستودع البيانات. فبحيرة البيانات ليست هي 
مستودع البيانات (كما اقترح البعض)» كما أنها ليست بديلًا له. فكلاهما مطلوبان ولذلك؛ فقد تمّ 
تحسينهما من أجل وسائط البيانات المختلفة واللهام/ الأغراض المتنوعة. ولذلك؛ فإن كلا الاثنين 
بحاجة إلى التعايش معًا في عالم التحليلات (على الأقل لفترة من الوقت حتى تصل بحيرات البيانات 
إلى مستوى من النضج يُحقَّق ما وصلت إليه مستودعات البيانات من الجودة في الوقت الحاضر). 
والهدف هو تصميم واستخدام كلّ منهما بشكلٍ صحيح للمهاءٌ التي يؤديها؛ بحيث يتم استخدام 
أفضل خيار للعمل» والذي قد يكون مزيجٌ من مستودعات البيانات وبحيرة البيانات. 
البُنية التحتية (التصميم - الأجهزة والبرمجيات - التحسينات): 
- العمودية (طريقة جديدة لمستودعات البيانات والوصول إليها في قاعدة البيانات): إِنَّ نظام 
إدارة قواعد البيانات باستخدام الأعمدة الموجّهة (والمعروف أيضًا باسم قاعدة البيانات 
العمودية). هو نظاءٌ يقوم بتخزين جداول البيانات كأجزاء من أعمدة البيانات بدلا من 
أنها صفوف من البيانات (وهي الطريقة التي يستخدمها (RDBMS phas‏ بمعنى 
أن تخزين قواعد البيانات يتم بشكل عموديً؛ فهذه البيانات تُخرّن بواسطة أعمدة بدلا من 
الصفوف (حيث يتم تخزينْ كافة قيّم عمود واحد بشكل متتابع على ذاكرة القرص). ومثل 
هذا الهيكل يعطي نوعاً من التحكّم أكثر دقة في 8151215. فهو يستطيعٌ الوصول إلى الأعمدة 
المطلوب الاستعلام عنها فقط دون أن يكون هناك اضطرارٌ إلى الوصول إلى كلّ أعمدة الصف؛ 
إذ يعمل بشكل أفضل بكثير فيما يخضٌ الاستعلامات التي تحتاج إلى نسبة صغيرة من الأعمدة 
في الجداول الموجودة بها؛ ولكنه يؤدي JS i alas‏ أسوأ عندما تكون هناك حاجةٌ إلى أعمدة 
كثيرة؛ بسبب الجهد الزائد المطلوب لربط كافة الأعمدة مكًا لتشكيل مجموعات النتائج. وعادةً 
ما تتعلق المقارنات بين مخططات بيانات الأعمدة الموجهة والصفوف الموجهة: بكفاءة الوصول 
إلى القرص الثابت؛ للقيام بتنزيل عمل مُحدَّد (والذي يُكَنُ واحدًا من أكثر العمليات التي 
تستغرق وقنًا طويلًا في الحاسب). وبناءً على المهمة المطروحة: يمكن لأحدهما أن يتمتع بمزايا 
أكثر من الآخر. ويكون نظام الأعمدة الموجهة أكثر كفاءة عندما: 
-١‏ يجب حساب الإجمالي من خلال العديد من الصفوف؛ ولكن فقط لمجموعة فرعية صغيرة؛ 
بحيث تكون هذه المجموعة أقل من إجمالي أعمدة البيانات؛ إذ إِنَّ قراءة هذه المجموعة 
الفرعية الأصغر من البيانات تكون أسرع من قراءة كلّ البيانات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YAO‏ 


الفصل الثالث 


ei -Y‏ تزويدُ جميع الصفوف بقيّم جديدة من أحد الأعمدة في وقت واحد؛ نظرًا لأن بيانات العمود 
يمكن كتابتها بكفاءة واستبدال بيانات الأعمدة القديمة دون لمس أي أعمدة أخرى للصفوف. 
في حين يكون نظام الصفوف الموجّهة أكثر كفاءةً عندما: 
-١‏ تكون أعمدة كثيرة من صف واحد مطلوبة في نفس الوقتء وعندما يكون حجم الصف صغيراً 
نسبيًّا؛ بحيث يمكن استرداد الصف بأكمله باستخدام قرص واحد. 
۲- يتم كتابة صَفْ جديدٍ إذا تمَّ توفير كافة بيانات العمود في نفس الوقت؛ إذ يمكن كتابة الصف 
بأكمله باستخدام قرص واحد. 
àLals‏ & إلى ذلك؟ فإنه نظرًا لأن البيانات المخرَّنة في أحد الأعمدة تكون من نوع مُوخّد؛ فإنّ 
ذلك يفسح المجال بشكلٍ أفضل للضغط بمعنى أنه يتوفر مساحة كبيرة لتخزين بيانات الأعمدة 
الموجّهةء وهذه المساحة لا تتوفر في بيانات الصفوف الموجهة» ومثل هذا الضغط اللْحْكّم للبيانات 
من شأنه أنه يقلّل من حجم التخزين؛ مما يجعله أكثر البدائل التي تجد قبولًا من الناحية 
الاقتصادية ممتابعة التخزين في الذاكرة أو الحالة الصلبة. 
- مستودعات البيانات الفورية: تنطوي عملية مستودعات البيانات الفورية (110117) على دورة 
تجديد مستودع البيانات الموجود؛ وذلك من أجل تحديث البيانات الأكثر تكرارًا (ويكون ذلك 
تقريبًا في نفس الوقت الذي تصبح فيه البيانات متاحةً في قواعد البيانات التشغيلية). فهذه 
الأنظمة (أنظمة Se (RDW‏ الوصول إلى تحديث البيانات بشكل فوري تقريبًا؛ إذ يستغرق 
وقت استجابة البيانات عادةً من دقائق إلى ساعات. ومع انخفاض وقت الاستجابة؛ فإن تكلفة 
تحديث البيانات تزداد بشكل كبير. وهناك حاجة إلى التقدّم مستقبلًا في العديد من المظاهر 
التقنية (بدءًا من اكتساب البيانات تلقائيًا وصولًا إلى أدوات البرمجيات الذكية) لجعل 1150117 
حقيقة واقعة بتكلفة معقولة. 
- أجهزة مستودعات البيانات (حلول الكل في واحد لدى 211): يتكوّن جهاز مستودع 
البيانات من مجموعة متكاملة من الخوادم» ووحدات التخزينء ونظام (أو أنظمة) التشغيلء 
وأنظمة إدارة قواعد البيانات» والبرمجيات اممثبتة بشكل مُسبّقء وامْتبّتة من أجل مستودعات 
البيانات. ومن الناحية العملية؛ فإن أجهزة مس تودع البيانات توفر حلولًا من أجل مس تودع 
البيانات المتوسطة لدى سوق مستودع البيانات الكبيرة؛ إذ تقدّم Fol‏ منخفصّ التكلفة على 
أحجام البيانات في نطاق من تيرابايت إلى نطاق البيتابايت. ويستخدم معظم مورّدي أجهزة 
وة عاف ااا colas‏ اة هرازه فة من أجل تعن الك B lll des‏ 


لذن ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


أن معظم مُورّدي قواعد البيانات ومستودعات البيانات يوفرون الأجهزة في الوقت الحاض غير 
أنَّ الكثيرين يعتقدون أن تيراداتا كانت أول من قَدَّم منتجًا يتمثل في جهاز لمستودعات البيانات 
التجارية. وأكثر ما يُلاحَظ حاليًا هو ظهورٌ حُرّم مستودعات البيانات؛ إذ يقوم المورّدون بِدَمْج 
برمجياتهم وقواعد بياناتهم كمنصّة لمستودعات البيانات. 
ما من ناحية مزايا أجهزة مستودع البيانات؛ فإنَّ التكلفة الإجمالية للحصول عليها وتبلّكها 
منخفضة للغاية» والتي تشمل تكاليف الشراء الأوليةء وتكاليف الصيانة المستمرة» وتكلفة تغيير 
السّعة مع نمو البيانات. كما تُشكَّل تكلفة الموارد اللازمة لمراقبة وضبط مستودع البيانات نسبةٌ 
كبيرةً من إجمالي تكلفة ASUI‏ وغالبًا ما تصل هذه النسبة إلى ./8١‏ وإضافةٌ إلى ما سبق؛ فإن 
أجهزة 1117 تعمل على الحَدَّ من إدارة العمليات اليومية والمتمثلة في التشغيل والإعداد والتكامل. 
ونظرًا لأن أجهزة مستودعات البيانات توفر حلَّ المورد الواحد؛ فإنها تتجه إلى تحسين الأجهزة 
والبرامج بشكل أفضل داخل الجهاز؛ إذ يعمل هذا التكامل الموحَّد على زيادة فرص الاندماج الناجح 
واختبار نظم إدارة قواعد البيانات (28215) والتخزين ونظام التشغيل عن طريق تجنّب بعض 
مشكلات التوافق التي تنشأ عن الحلول التي يقدّمها مُورّدون مُتعدّدون. كما يوفر جهاز مستودع 
البيانات نقطة اتصال واحدة لحَلَّ المشكلة ومسار ترقية أبسط بكثير لكل من البرامج والأجهزة. 
- تقنيات وممارسات إدارة البيانات: تتضمَّن بعض الاحتياجات الْلخَّة للجيل القادم من برنامج 
مستودع البيانات التقنيات والممارسات التي لا نفكّر فيها عمومًا على اعتبار أنها جزءٌ من النظام 
الأساسي؛ إذ يحتاجُ العديدٌ من المستخدمين على وجه الخصوص إلى تحديث أدوات إدارة البيانات 
التي تعمل على معالجة البيانات؛ لتصبح صالحةً للاستخدام من خلال مستودع البيانات. ويحمل 
المستقبل نموًا قويًا (MDM) åw I SLUJI joy‏ ورغم كون هذا المفهوم جديداً نسبيًا غير 
أنه بالغ الأهميةء وسوف يَخظى بشعبية كبيرة لعدّة أسباب» وتشمل ما يلي: 
-١‏ إن الدّمج المحكّم مع الأنظمة التشغيلية يحتاجٌ إلى إدارة بيانات رئيسية (0/]221). 
-Y‏ إن معظم مستودعات البيانات لا تزال تفتقرٌ إلى وظائف إدارة البيانات الرئيسية وجودة البيانات. 
۴- يجب أن تكون التقاريرٌ التنظيمية والمالية دقيقةً ونظيفة تمامًا. 
- تقنية معالجة قاعدة البيانات (وَضع نظام الحلول الحسابية حيث تكون البيانات): تشيرٌ 
معالجة قواعد البيانات (وتَسمّى أيضًا تحليلات قواعد البيانات) إلى مدى التكامل الحسابي 
لتحليلات البيانات في مستودع البيانات. وبمجرد القيام بذلك؛ فإن البيانات والتحليلات تتكاملٌ 
لتصبح ضمن بيئة واحدة. فوجود كلا الاثنين في بيئة واحدة يزيد من كفاءة إجراء التحليل 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YN‏ 


الفصل الثالث 


الحسابي المكثف. واليوم تعتمدٌ العديدٌ من أنظمة اتخاذ القرارات على قواعد البيانات الكبيرة 
مثل تلك المُستخدّمة في الكشف عن الاحتيال على بطاقات الائت مان وإدارة مخاطر البنوك 
الاستثمارية؛ إذ تُستَخدّم هذه التقنية نظرًا لإظهارها تَحسّنَا كبيرًا في الأداء يتفوق على الطرق 
التقليدية في بيئة اتخاذ القرار. والتي يُشْكَل فيها الوقت عاملًا مهمًا. dis‏ معالجة قواعد 
البيانات عمليةً معقدةً إذا ما قورنت بالطريقة التقليدية لإجراء التحليلات؛ إذ يتم نقل البيانات 
خارج قاعدة البيانات (وغالبًا ما تكون في شكل ملفات مُسَطّحَة تتألف من صفوف وأعمدة) 
إلى بيئة تحليلية منفصlة gf Statistica Data Miner 5| SAS Enterprise Modeler Jès)‏ 
)]BM SPSS Modeler‏ للمعالجة. 
وعد ال معالجة داخل قواعد البيانات أكثر منطقية بالنسبة لبيئات التطبيق ات العالية 
الإنتاجية الفورية» والتي تتضمّن شف الاحتيال» وسجل الائتمان» وإدارة المخاطرء ومعالجة 
المعاملات والتسعير وتحليل الهامشء والتجزثة الدقيقة المستندة إلى الاستخدام؛ واستهداف 
الإعلانات السلوكيةء ومحركات التوصية» مثل تلك التي تستخدمها مؤسسات خدمة العملاء 
لتحديد الإجراءات التالية الأفضلء ويتم تنفيذ ومعالجة البيانات داخل قاعدة البيانات على 
اعتبار أنها مَيْرْةَ من قبل العديد من مُورّدي مستودعات البيانات الرئيسيينء بما في ذلك 
È SAS analytics Shu g—5) lohs‏ أجهزة مستودعات البيانات): وNetezza «18M‏ 
Sybases .EMC Greenplums‏ من بین البرامج الأخرى. 
- تقنية التخزين في الذاكرة (نقل البيانات في الذاكرة؛ حتى تتم المعالجة بشكل أسرع): تستخدم 
أنظمة قواعد البيائات التقليدية مثل Sys RDBMS‏ الأقراض الصلبة الفعلية لمستودعات 
البيانات بشكل مثالي لفترة طويلة من الوقت؛ إذ يقوم نظام إدارة قاعدة البيانات بتنزيل البيانات 
JI (BL ia eel gl‏ الذاكزة الرفيسية عند طلب:عملية متعلقة بالبيانات ووابنطة Jo]‏ 
التطبيقات» ويعالجهاء ويستجيب مرةً أخرى للتطبيق. وعلى الرغم من أن البيانات (أو أجزاء 
GA (OLLI oa‏ مؤقنًا في الذاكرة الرئيسية في نظام إدارة قاعدة البيانات؛ فإِنَّ موقع التخزين 
الأساسي يظل عبارة عن قرص مغناطيسي ثابت. وفي المقابل؛ فإن نظام قاعدة البيانات في الذاكرة 
يقوم بالاحتفاظ بالبيانات بشكل دائم في الذاكرة الرئيسية. وعندما تُطلب عملية تتعلق بالبيانات 
بواسطة تطبيق ما؛ فإن نظام إدارة me‏ البيانات يصل مباشرةً إلى البيانات الموجودة بالفعل في 
الذاكرة Bye c tas dads cda‏ أخرق اللقطبيق الذي يظلبةء إن هذا الوصول اباش 
إلى البيانات في الذاكرة الرئيسة يجعل معالجة أوامر البيانات أسرع بكثير من الطريقة التقليدية. 


YM‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (7): ذكاء الأعمال ومستودعات البيانات 


لذا؛ فإنَّ الفائدة الرئيسة للتقنية في الذاكرة (بل قد تكون الفائدة الوحيدة لها) تتمثل السرعة 
المذهلة التي تصل بها إلى البيانات. S‏ العيوب فتشمل: تكلفة الحصول على ذاكرة رئيسة 
كبيرة للغاية (فحتى لو تم الحصول عليها بتكلفة أقلء إلا أنه لا يزال هناك الكثيرٌ لتوفير ذاكرة 
رئيسية كافية لاحتواء جميع بيانات الشركة)» إضافةً إلى الحاجة إلى إستراتيجيات معقدة لاستعادةً 
البيانات (لأن الذاكرة الرئيسية مُتقلّبة ويمكن محوها بطريق الخطأ). 

- نظم إدارة قواعد البيانات الجديدة: تتكوّن dale‏ مستودع البيانات من عدَّة مكونات أساسية 
أهمّها نظام إدارة قواعد (DBMS) SLLJI‏ وَيُعَنُ ذلك أمرًا طبيعيا فقط؛ لأن نظام إدارة 
قواعد البيانات (2181/15) هو مُكوّن النظام الأساسي؛ إذ إِنَّ معظم العمل يجب إنجازه بغرض 
تنفيذ نموذج بيانات وتحسينه لأداء الاستعلام. ولذلك؟ فإنَّ نظام إدارة قواعد البيانات (1083/15) 
هو المكان الذي يتوقع أن تحدث فيه العديدٌ من ابتكارات الجيل التالي. 

- تحليلات مُتقدّمة: هناك طرق تحليلية مختلفة يمكن للمستخدمين اختيارها في أثناء انتقالهم 
إلى ما وراء الأساليب الأساسية المستندة إلى 01.45 والتحليلات المتقدّمة. إذ يختار بعش 
المستخدمين طرقًا تحليليةً متقدمةً تعتمدٌ على التنقيب في البيانات» والتحليلات التنبؤية 
والإحصاءات» والذكاء الاصطناعي» وما إلى ذلك. ومع ذلك؛ فمن الواضح أن غالبية المستخدمين 
يختارون الأساليب المستندة إلى 5©[1. وسواءً اعتمدوا على .5091 أم لا؛ فيبدو أن التحليلات 
المتقدّمة تُعَدُ من بين أهمٌ الأمور المُبِشَّرة بنجاح مستودعات البيانات في الجيل التالي. 

ومن الواضح أن مستقبل مستودعات البيانات مليءٌ بالوعود والتحَدَّيات الكبيرة. وإذ إِنَّ عام 

الأعمال أصبح أكثر عالميةً وتعقيدًا؛ فإن الحاجة إلى أدوات ذكاء الأعمال وأدوات استرجاع البيانات 

سوف تصبح أكثر من ذي قبل. كما يبدو أن أدوات وتقنيات تقنية المعلومات سريعة التحشّن 

تتحرك في الاتجاه الصحيح لتلبية احتياجات أنظمة ذكاء الأعمال المستقبلية. 


أسئلة مراجعة على القسم MY‏ 

-١‏ ما الخطوات التي يمكن للمؤسسة اتخاذها لضمان أمان وسرية بيانات العميل في مستودع 
البيانات الخاص بها؟ 

lo -Y‏ هي المهارات التي يجبٌ أن تتوفر في SDWA‏ ولماذا؟ 

- ما هي التقنيات الحديثة التي قد تشكّل مستقبل مستودعات البيانات؟ ولماذا؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري A۹‏ 


الفصل الثالث 


٩-۳‏ إدارة أداء الأعمال: 
تنتهي العديدٌ من تطبيقات مستودع البيانات بتطوير نظام إدارة أداء الأعمال (/0852). 
ففي الأعمال والأدبيات التجارية؛ نجد أنَّ 8511 لديها عددٌ من الأسماء بما في ذلك إدارة أداء 
الشركات (0221). وإدارة أداء المؤسسات (82281): وإدارة المشاريع الإستراتيجية (51821). وقد 
تمّ إنشاءٌ CPM‏ بواسطة 5 :EPM ellas ls (gartner.com) (8541 Joc) Garner à$‏ 
فهو مصطلحٌ bas‏ بعروض glia sa$ :SEM Ul; .e. 2I guà Oracle (oracle.com)‏ 
الذي تستخدمه 542 (2م60.م54). وفي هذا الفصل؛ يُفضّل مصطلح 82231 على المصطلحات 
الأخرى؛ لأنه الأقدم: والأكثر استخدامًا بشكلٍ cele‏ والوحيد الذي لا يرتبط ارتباطًا وثيقًا جموفر الحل 
الواحد. ويشير مصطلح إدارة أداء الأعمال iib JI (BPM)‏ سَيْر الأعمال والمنهجيات والمقاييس 
والتقنيات الممستخدّمة من قبل الشركات لقياس أداء الأعمال ومراقبتها وإدارتها. ويشمل ثلاثة 
مكونات رئيسية (2009 ,0015 ): 
-١‏ مجموعة من الإدارات المتكاملة في حلقة مغلقة» وعمليات التحليل (مدعومة بالتقنية) التي 
تتناول الأنشطة المالية» وكذلك الأنشطة التشغيلية. 
-١‏ أدوات للشركات لتحديد الأهداف الإستراتيجية» ومن تم قياسٌ وإدارة الأداء في مقابل تلك الأهداف. 
- مجموعة أساسية من العمليات: بما في ذلك التخطيط امالي والتشغيلي: والاندماج وتقديم التقاريرء 
والنمذجة» والتحليلء ورصْد مؤشرات الأداء الرئيسية (1215). المرتبطة بالإستراتيجية التنظيمية. 


BPM 8595‏ المغلقة: 


ربما يكون أهمّ الاختلافات بين 8834 وأيّ أدوات وممارسات أخرى لذكاء الأعمال. هو التركيز 
على الإستراتيجية الخاصة به؛ إذ يشمل 8811 مجموعةً من العمليات المغلقة التي تربط 
الإستراتيجية بالتنفيذ لتحسين أداء الأعمال (انظر: شكل .)١1-‏ ويُقصّد بالحلقة؛ أن الأداء الأمثل 
يتحقق من خلال تحديد الأهداف والغايات (أيْ: وَضْع إستراتيجية): وإنشاء مبادرات وخطط 
لتحقيق تلك الأهداف (أيْ: خطة). ومراقبة الأداء الفعلي مقابل الأهداف والغايات (أَيْ: المراقبة)» 
واتخاذ الفعل المناسب للإصلاح (أيْ: الفعل والضبط). فالطبيعة المستمرة والمتكرّرة للدورة تعني 
أنَّ إكمال التكرار يؤدي إلى عملية جديدة ومُحسّنة (دعم الجهود المستمرة لتحسين العمليات). 
ونتناول في هذا القسم وَضْف هذه العمليات الأربع. 


ys.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


الإستراتيجية 











شكل *-17: حلقة مغلقة لدورة 18511 


-١‏ وَضْع الإستراتيجية: أين نريد أن نذهب؟ 

تُعرّف الإستراتيجية بشكل عام, بأنها خُطَّةَ عمل عالية المستوىء تشمل فترةً زمنيةً طويلةٌ 
(غالبًا عدة سنوات) لتحقيق هدف مُحدّد. وهي ضروريةٌ بشكلٍ خاص في حالة وجود العديد 
من القيود (مدفوعة بأوضاع السوقء وتوفّر الموارد. والتعديلات القانونية/ السياسية) للتعامل 
معها في طريقها نحو تحقيق الهدف. في حين تُعرّف الإستراتيجية في إطار الأعمال التجارية بأنها 
KC‏ وعلمٌ صياغة القرارات التي تساعد الشركات على تحقيق أهدافها. وبشكل أكثر تحديدًا؛ فهي 
عملية تحديد وتوضيح مهمة المنظمة ورؤيتها وأهدافها وضع خطط (على مستويات مختلفة 
من الدقة - الإستراتيجية والتكتيكية والتشغيلية) لتحقيق هذه الأهداف. 

exo ls Bale‏ إنشاءٌ وتخطيط إستراتيجيات الأعمال من قبل فريق من المسؤولين التنفيذيين 
في الشركات LU)‏ يقود هذا الفريق المديرٌ التنفيذي). ويقوم مجلس الإدارة بالموافقة عليها 
والتصريح بهاء ثم يقوم فريق إدارة الشركة بتنفيذها تحت إشراف كبار المسؤولين التنفيذيين. 
وتوفر إستراتيجية الأعمال اتجاهًا عامًّا للمؤسسة وتَعَدٌ أول وأهمّ عملية في منهجية 821/1. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yai‏ 








الفصل الثالث 


-y‏ الخطة: كيف تصل إلى هناك؟ 

عندما يعلمٌ المديرون التنفيذيون ويفهمون ما (الأهدافء والأهداف التنظيمية)» سيكونون 
قادرين على التوصل إلى كيفية (وضع خطط تشغيلية ومالية مُفضَّلة)؛ بحيث تجيبٌ الخطط 
التشغيلية والمالية عن سؤالين: ما هي التكتيكات والمبادرات التي zuo‏ اتباعها لتحقيق أهداف 
الأداء الممحدّدة في الخطة الإستراتيجية؟ وما هي النتائج المالية المتوقعة لتنفيذ التكتيكات؟ 

تعمل الخطة التشغيلية على ترجمة الأهداف والأهداف الإستراتيجية لمنظمة ما إلى مجموعة 
من التكتيكات والمبادرات المحدّدة جيدًا ومتطلبات ا وارد» والنتائج المتوقعة لبعض الوقت في 
المستقبلء وعادةً (ولكن ليس دائمًا) ما تكون هذه المدة عامًا. وتشبه خطة التشغيل في جوهرها 
خطة المشروع التي تمّ تصميمها؛ لضمان تحقيق إستراتيجية المؤسسة؛ وتشتمل معظم الخطط 
التشغيلية على مجموعة من التكتيكات والمبادرات. وأمّا مفتاح النجاح في التخطيط التشغيلي فهو 
التكامل. وتقود الإستراتيجية إلى التكتيكات» وتقود التكتيكات إلى النتائج. وبشكل أساسي cag‏ ربط 
التكتيكات والمبادرات المُحدّدة في خطة تشغيلية بشكلٍ مباشر بالأهداف والغايات الرئيسية في الخطة 
الإستراتيجية. وإذا للم يكن هناك ارتباطً بين تكتيك فردي وهدف أو أهداف إستراتيجية أو أكثر؛ فإنه 
ينبغى على الإدارة أن تتساءل عمًّا إذا كان التكتيك والمبادرات المرتبطة به مطلوبةً فعلًا على الإطلاق. 
وقد تمّ تصميمٌ منهجيات 8811 والتي ستناقش لاحقاً في هذا الفصل للتأكد من وجود هذه الروابط. 

إنَّ عملية التخطيط ووَضْع الميزانية المالية لديها بنية منطقية تبدأ عادةً بتلك التكتيكات 
التي تُولّد شكلاً من أشكال الإيرادات أو الدخل. وتعتمدٌ القدرة على توليد الدخل في المنظمات 
التق تبيع:الشلع أواالخدمات ما غاى القدرة ها إنتاع التشلع:والخدمات مباشرة: أو الحصول 
على الكمية المناسبة من السلع والخدمات للبيع. وبعد تحديد رقم الإيرادات؛ فإنه يمكن توليد 
التكاليف ال مرتبطة بتسليم ذلك المستوى من الإيرادات. وفي كثير من الأحيان؛ فإن ذلك يستلزمٌ 
مدخلات من عدة أقساء أو تكتيكات. .وهذا يعنى أنه يجِبٌ أن تتم هذه العملية بطريقة تعاونية 
وأن التبعية بين المهامٌ glas‏ أن يتم توصيلها وفهمها بوضوح. وإضافةً إلى المدخلات التعاونية؛ 
فإن المنظمة تحتاج أيضًَّا إلى إضافة العديد من التكاليف العامة؛ فضلًا عن تكاليف رأس المال 
المطلوب. وبمجرد دَمْج هذه المعلومات؛ فإنها تُوضّح التكلفة بالتكتيك فضا عن المتطلبات 
النقدية والتمويلية لوضع الخطة موضع التنفيذ. 


yay‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


۳- المراقبة/ التحليل: كيف نؤدي؟ 

من الضروري مراقبة أداء المنظمة عندما تكون الخطط التشغيلية واطمالية قيْد التنفيذ. وينبغخي 
أن يتناول الإطار الشامل لرصد الأداء قضيتين رئيسيتين» وهما: ما الذي يجب مراقبته» وكيفية 
مراقبته. ونظرًا؛ لأنه من المستحيل ملاحظة ÍS‏ شيء؛ فإن المنظمة تحتاج إلى التركيز على Als‏ 
قضايا مُحدّدة. وبعد أن تُحدَّد المنظمة المؤشرات أو المقاييس التي يجب ملاحظتها؛ فإنها تحتاج 
إلى تطوير إستراتيجية لرَصُد تلك العوامل والاستجابة لها بفعالية. وغالبًا ما GAS‏ هذه المقاييس 
مؤشرات الأداء الرئيسية (أو 12815 باختصار). وسوف نقدّم نظرةً عامة على عملية تحديد 
مؤشرات الأداء الرئيسة لاحقًا في هذا الفصل. وهناك موضوعٌ آخر له صلة باختيار ا مجموعة 
ا مثلى من مؤشرات الأداء الرئيسة وهو طريقة بطاقة نقاط التوازن» والتي سيتمٌ تغطيتها بالتفصيل 
لاحقًا في هذا الفصل. 
ع- الفعل والضبط: ما الذي نحتاج إلى القيام به بشكلٍ مختلف؟ 

وسواءً أكانت الشركة مهتمة بتنمية أعمالها أو حتى على الأقل بتحسين عملياتها؛ فإن جميع 
الإستراتيجيات تعتمد فعليًا على مشروعات جديدة كإنتاج منتجات جديدة: أو دخول أسواق 
ausus‏ أو اكتساب عملاء جُدد أو شركات جديدة: أو تبسيط بعض العمليات. وتتعامل معظم 
الشركات مع هذه المشاريع الجديدة بروح من التفاؤل بدلا من الموضوعية» متجاهلةٌ حقيقة أن 
معظم المشاريع القائمة والمشاريع الجديدة تفشل. ولكن ما هي فرصة الفشل؟ من الواضح؛ أن 
ذلك يعتمد على نوع المشروع (2007 eli. (Slywotzky & Web,‏ هوليود تضع نسبة احتمال 
للفشل حوالي .1٠١‏ وينطبق الثيء نفسه على عمليات الدّمج والاستحواذ. كما أن مشاريع تقنية 
المعلومات الكبيرة تفشل معدل ۷0<. وبالنسبة للمنتجات الغذائية الجديدة؛ فإن معدل الفشل 
هو .”8٠‏ أمّا بالنسبة للمنتجات الصيدلانية الجديدة؛ فإن نسبة احتمال الفشل أعلى من ذلك؛ 
فهي حوالي .76٠‏ وعمومًا فإن معدل الفشل لمعظم المشاريع القائمة أو المشاريع الجديدة يمتدٌ 
ما بين 7٠‏ و١486.‏ وبالنظر إلى هذه الأرقام؛ فإن الإجابة على سؤال «ماذا نحتاج أن نفعل بشكل 
مختلف؟» تصبح قضية حيوية. 

وتوضّح الحالة العملية *-0 كيف حققت منظمةٌ كبيرةٌ غير ربحية نتائج استثنائية عن طريق 
تحويل وتحديث بنية ذكاء الأعمال الخاصة بها مع أجهزة مستودعات البيانات في العصر الحديث. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yay‏ 


الفصل الثالث 


حالة عملية 0-1 
AARP‏ تقوم بتحويل بنية ذكاء الأعمال التحتية 
وتحقق عائد استثمار بنسبة لاع 1*1 في ثلاث سنوات 

تُعَذّ 1 ,4418 - وهي الرابطة الأمريكية للأشخاص المتقاعدين سابقًا - مجموعة 
ذات شأن وعضوية مقرِّها الولايات المتحدة, تأسَّست في عام 1904م من قبل Ethel‏ 
Percy Andrus‏ وه„ مُعلّمة متقاعدة من كاليفورنيا حاضلة على الدكتوراه و 
Leonard Davis‏ مؤسس مجموعة المستعمرات ۴٠۸۸‏ لشركات التأمين. وكما هو 
مُوضّح في موقع الويب الخاص بهم (068.م:ةة)؛ فإن الرابطة تُعَذُ منظمةً غير ربحية 
وغير حزبية» كما أنها منظمة رعاية اجتماعية تضم ما يقرب من ۳۸ مليون شخص؛ 
إذ تساعد الناس على تحويل أهدافهم وأحلامهم إلى إمكانيات حقيقية: كما تعرز 
المجتمعات ال محلية. وتحارب من أجل القضايا المهمة للعائلات مثل: الرعاية الصحية. 
والتوظيف» والأمن» والدخلء والحماية من سوء المعاملة اطالية. 

تزايد الطلب على ذكاء الأعمال: 

في عام ۲١١۲م»‏ أطلقت ال منظمة لأوَّل مرة مبادرة ذكاء الأعمال التي من شأنها أن 
تمركز المعلومات (تمتلك ۸4۸۴ مكاتب في جميع الولايات الخمسين؛ إضافة إلى مقاطعة 
كولومبيا)» وقد تمن موظفوها مع توفر تحليلات حالية وملائمة ودقيقة ومرنة من: 

- ملاءمة الخدمات وعروض المنتجات للقاعدة العضوية والتوقعات. 

- تحسين ربحية الأعضاء والاحتفاظ بهم» وگسبهم. 

- حماية صورة العلامة التجارية ل 448185 من خلال إدارة العلاقات مع مزؤّدي 
الخدمات التابعين لجهات خارجية. 

وقد ساعدت هذه الرؤية ف تعزيز نجاح الرابطةء ومع هذا النجاح؛ جاءت كميات 
أكبر من البيانات وزيادة الطلب على التحليلات الجديدة. 

وبحلول عام ۲۰۰۹م» واجه فریق ذکاء الأعمال BS Caas‏ |3 م يَعْد مستودع 
البيانات الخاص بهم - المستند على قاعدة بيانات :501 العلائقية من 41ء0 - قادرا 
على مواكبة الطلب؛ إذ شهد الفريق أكثر من ٠١‏ حالة فشل في تلك السنة. وقد كان 
هذا الأمر مكلقًا وغير مقبول. 


yae‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الأعمال ومستودعات البيانات 


وإضافة إلى ما سبق؛ فقد كان أداء النظام مصدر قلق رئيسي. ونظرًا لتزايد حجم 
bll‏ وعد إكمال التنزيل اليومي إلى مستودع المستندات حتى الساعة Elwa Yis‏ 
- وهو ما أثر على طول مدة انتظار الموظفين للتقارير. تقول بروني مديرة ممارسة ذكاء 
الأعمال» 44۸۶: «كان محللونا يقومون بإعداد تقريرء ثم الذهاب لتناول القهوة أو 
لتناول طعام الغداء» ورها يحصلون على الرّدء إذا كانوا محظوظينء بحلول الساعة 6:٠٠‏ 
مساءً؛ إن هذا الأمر كان غير مقبول؛ فقد كان النظام مشغولًا للغاية في كتابة البيانات 
اليومية الجديدة لدرجة أنه لم يعط Sl‏ أهمية لعمليات القراءة التي قام بها ا مستخدمون». 

وم يتمكّن المحللون أيضًا من إنشاء استعلامات مُخصّصة دون تدخل لتقنية المعلومات. 
فعندما تلقّت تقنية المعلومات طلباً نوع جديد من التقارير؛ كان على فريق ذكاء الأعمال 
تحسين الاستعلامات وإرسال نموذج تقرير مرةً أخرى إلى الطالبين للمراجعة. وتستغرق هذه 
العملية من بدايتها إلى نهايتها من أسابيع إلى شهور. وقد وجد الموظفون أخيرًا أنه من 
المستحيل عمل نسخة احتياطية من النظام كل ليلة بوجود أكثر من 1 تيرابايت من البيانات 
في مستودع البيانات. ولذلك؛ فقد اقتصرت gii‏ الاحتياطية على بضع جداول حرجة؛ مما 
جعل من الصعب على الموظفين إنشاء خطة فعّالة لاستعادة القدرة على العمل بعد الكوارث. 

ووفقاً لبروني؛ فإن هذا الأمر إذا ترك دون حَلّ فمن الممكن أن تؤثر هذه التصدّعات 
على عمل الرابطة. تقول بروني: «يوفر التحليل مقاييس أساسية مهمة لتقييم مدى 
تحقيق عضويتنا وأهدافنا الاجتماعية؛ فمن الضروري تمكين التحسين المستمر واتخاذ 
القرارات؛ لدعم احتياجات الأعضاء». 

إنشاء بيئة رشيقة لذكاء الأعمال: 


نظرًا لتطلّح فريق بروفي إلى تحديث بيئة ذكاء الأعمال؛ فقد قاموا بتقييم خيارين» 
وهما: تحسين البيئة الحالية أو الانتقال إلى جهاز مستودع بيانات واحد. تقول بروني: 
«لقد وجدنا تكلفة كلّ خيار قابلة للمقارنة؛ ولكن الجهاز فقط هو الذي قدَّم لنا 
نقلةً نوعيةً فيما يتعلق بالأداء الذي كنا نحتاجه. ومن بين الخيارين المختلفين اللذين 
درسناهماء استطاع جهاز مستودعات البيانات of IBM Netezza‏ يتفوق على الخيار 
الآخر؛ نظرًا لكونه أكثر أمانّا؛ إذ إنه لم يتطلب من نموذج البيانات ضبطًا دقيقًا لمخازن 
البيانات الأخرى. وإضافةً إلى ذلك؛ فقد استطعنا تجربة الجهاز قبل شرائه لمعرفة 
حقيقة ما إذا كان بإمكانه فعْل JS‏ ما نحتاج إليه أم لاء وذلك على الرغم من أن معظم 
البائعين لا يقدّمون هذا النوع من الخيارات وهو (تجربة الجهاز قبل الشراء)». 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yao‏ 


الفصل الثالث 


z 


وقد تبَنّت المنظمة نموذج تطوير «سكروم» في LII idl elu‏ والذي يُستخدّم 
عادةً من قبل مُطوّري البرامج؛ لتوفير إطار عمل يختصر دورات التطويرء كما أنه 
p ou‏ الوقت لتسويق طلبات ذكاء الأعمال. وتضيف بروني: «إن استخدام سكروم في 
مستودعات البيانات؛ هو شيءٌ جديدٌ لم يسمع به أحد؛ لكن المبدأ الأساسي الذي يقدّمه 
هو عملية مرنة وتكرارية تمكّننا من تحويل الاحتياجات التحليلية للمستخدمين بسرعة 
إلى تقارير تشغيلية تُظهر بيانات ذات معنى». 


وخلال 9 أشهر من اقتناء الجهاز الجديد؛ قام الفريق بتحويل جميع النصوص 
والإجراءات من قاعدة بيانات أوراكل إلى جهاز مستودع البيانات ۸224 .18M‏ ويتمُ 
Ub‏ تنزيلٌ مصادر بيانات كلّ من الحسابات الأساسية وبيانات العضوية (التي تتواجد 
18M DB2 à‏ لقاعدة بیانات 2/08 والتي تعمل (de‏ خادم Clos (IBM System z‏ 
الموارد المالية والبشرية من قواعد بيانات أصغر أخرىء وبيانات تحليل وتجزئة الحملات 
من بيانات جهات خارجية في جهاز مستودع o `! AU IBM Netezza SLslI‏ 
الوصول إليها من خلال أدوات ذكاء الأعمال للمنظمة دون انقطاع. 

تشغيل استعلامات مُعفّدة في سرعة البرق: 

من حيث الأداء (والذي كان أكثر اهتمامات فريق ذكاء الأعمال إلحاحًا)؛ فإن إكمال 
تنزيل البيانات اليومية الآن يتم قبل الساعة 8:٠٠‏ صباحًاء وهو تحسن بنسبة 1/16٠٠‏ 
كما أن إكمال التقارير التي كانت تستغرق دقائق من قبل للتشغيل أصبح يتم الآن في 
عدة ثوان» وهو تحسن بنسبة .۱۷٠١‏ وفضلَا عن ذلك؛ فقد ساعد اقتناء الجهاز أيضًا 
في ضغط حجم البيانات من 1 تيرابايت إلى ٠,١‏ تيرا بايت فقط؛ مما يتيح لفريق العمل 
الاحتفاظ بنسخة احتياطية من مستودع البيانات في ٠١‏ دقيقة فقط. 

وعلى نفس القدر من الأهمية؛ فإن ما يقرب من ۲۲١‏ من موظفي الموارد البشريةء 
واممالية. والتسويق» إضافةً إلى موظفي الحملة الذين يستخدمون هذا النظام؛ يمكنهم 
الآن إجراء ما تشير إليه بروني بأنه «تحليل تدريب الفكر»؛ بمعنى إنشاء تقارير 
مُخصّصة لاختبار النظريات المتعَلّقة باحتياجات العضوية. وتقول بروني: «إن جهاز 
مستودع البيانات 71616228 181/1 يشبه قيادة سيارة فيراري» Úle basó sä‏ جديدًا من 
الإمكانيات لعملائنا الداخليين» الذين يمكنهم فعلًا إنشاءٌ تقارير على الفور والحصول 
على النتائج في غضون ثوانٍ معدودة. وقد شَّهدنا ارتفاعًا كبيًا في عدد التقارير التي 


Yan‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (7): ذكاء الأعمال ومستودعات البيانات 


تم إنشاؤها في الأشهر القليلة الأولى من التشغيل؛ أي ما يقرب من ثلاثة أضعاف الرقم 
الذي كنا قد أيّدناه من قبل. وإضافةً إلى الغوص العميق الذي مُمكنهم القيامُ به الآن؛ 


فقد شهدنا 15g‏ ثابثًا في عمليات تجديد العضويات واكتساب أعضاء جدد. والمشاركات». 

تحقيق عائد الاستثمار السريع: 

كما مكّن النظامٌ الأساسي الجديد المنظمة من إعادة نشر موظفي دَعْم تقنية 
المعلومات من مجموعة ذكاء الأعمال إلى مناطق أخرى. فقد كان الفريق في السابق 
بحاجة إلى مسؤول قاعدة بيانات بدوام كامل (1184) إلى جانب دَعْم جزثي من شبكة 
منطقة التخزين الخاصة بالمنظمة (5471): وفرق الخدمة المتوسطة. تقول بروني: «إنه 
لأمرٌ مدهشٌ م نَعُد بحاجة إلى دعم تقنية ا معلومات؛ إذ يتم شَّحْن جهاز مستودع 
البيانات 71606228 1181/4 بالفعل. فقط امنحه القوة. واعطه شبكة:. وبفعل ذلك فقد 
انتهي الأمرء ولا يحتاج أي شيء آخر». 

وقد مكّنت هذه التحسينات المؤسسة من تحقيق عائد استثماري بنسبة 9 في 
السنة الأولى» مع عائد استثمار متوقع بنسبة ۷٤‏ في السنة الثانيةء واستثمار بنسبة 
۷ بحلول السنة الثالثة. تقول بروني: «لقد أظهر تحليلنا الأولي عائد استثمار إيجابي 
في العام الأول» وهو أمرٌ غير مألوف أبدًا بالنسبة لتحديث البنية التحتية؛ نظرًا إلى أن 
جميع التكاليف غير متكررة في السنة الأولى» ولقد كان التنفيذ الفعلي لمعدل العائد 
على الاستثمار أعلى من ذلك؛ أنهينا عملية المقايضة قبل ثلاثة أشهر من ال موعد المحدد». 

توسيع تأثير ذكاء الأعمال: 

لقد أدرك فريق بروني القيمة العالية لذكاء الأعمال في المنظمة من خلال تحديث 
بنيته التحتية. تقول بروني: «بعد أن انتقلنا إلى 2766222 18M‏ انتشر الكلام بأننا كنا 
نفعل الأشياء بشكلٍ صحيح. وأن الاستفادة من الخدمة الداخلية كانت ذكية للغاية؛ لقد 
اكتسبنا مجالات حيوية جديدة للمهمة. مثل منطقة التأثير الاجتماعي التي تدعم حملاتنا؛ 
من أجل القضاء على الجوع» وإنشاء حملات جيدة تستند إلى حقيقة أن لدينا بنية تحتية 
قوية. وإضافةً إلى ذلك؛ فقد غيّرنا منهجنا في العمل؛ إذ يمكننا التطوير بطريقة أكثر مرونة 
هذا من ناحية التنمية. أمَّا من ناحية إدارة البرنامج؛ فإنها تقلّص دورات إطلاقنا من 
أشهر - والتي تتناسب مع البُنَى التحتية التقليدية لبرمجيات البيانات - فقط لعدة أسابيع. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yav‏ 


الفصل الثالث 


أسئلة للمناقشة: 

-١‏ ما هي التحَدَّيات التي تواجهها الرابطة؟ 

۲- ماذا كان النهجٌ المتّبع من أجل وَضْعِ d>‏ ممكن؟ 

-Y‏ ما هي النتائج التي تم الحصول عليها على المدى القصير؟ وماذا كانت الخطط المستقبلية؟ 
Source: IBM customer success story (2011). AARP transforms its business‏ 
intelligence infrastructure—Achieving a 34796 ROI in three years from BI‏ 


modernization effort. http://www-03.ibm.com/soft-ware/businesscasestudies/us/en/ 


corp?synkey-A735189Y23828M82 (accessed June 2016).‏ 
أسئلة مراجعة على القسم "-9: 
-١‏ ما هي إدارة أداء الأعمال؟ كيف ترتبط بذكاء الأعمال؟ 
؟- ما هي المكونات الرئيسية الثلاثة لنظام $BPM‏ 
۳- اذكر المراحل الأربع لدورة 8234 وصفها بإيجاز. 
-٤‏ لماذا تُعَدٌ الإستراتيجية هي الجزء الأكثر أهميةً من تنفيذ 821/1؟ 


۳-.1 مقياس الأداء: 

إن نظام 853 هو نظامٌ لقياس الأداء. ووفقًا مما ذكره (2002) 51205 l‏ نُظُّم قياس الأداء؛ هي: 
«مساعدة المديرين في متابعة تنفيذ إستراتيجية الأعمال؛ من خلال مقارنة النتائج الفعلية بالأهداف 
والغايات الإستراتيجية, وعادةً ما يشتمل نظام قياس الأداء على طرق منهجية لتحديد أهداف العمل 
مع تقارير ردود الأفعال الدورية التي تشير إلى التقدم في تحقيق الأهداف» (ص .)1١8‏ 

الجديرٌ بالذكر أن كلّ أنظمة القياس تدور حول المقارنات. ونادرًا ما تكون الأرقام الأوِّية ذات 
قيمة. فإذا تمّ إخبارك بأن أحد مندوبي المبيعات قد أكمل *0٠‏ من الصفقات التي كان يعمل عليها 
خلال شهر واحد؛ فلن يكون il eU‏ معنى يُذگر. ولنفترض الآن أنه تم إخبارك بأن الشخص نفسه 
الذي قام با مبيعات لديه معدل إغلاق شهري بنسبة <٠١‏ في العام الماضي. فالظاهر أن هذا الاتجاه 
جيد. ولكن ماذا لو تمّ إخبارك أيضًا بأن معدل الإغلاق اليومي لجميع مندوي المبيعات في الشركة 
كان ١8/؟‏ وقتها يظهر لك أن مندوب مبيعات معين يحتاج إلى زيادة السرعة. وكما يُوحي تعريف 


YSA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


5 لقياس الأداء؛ فإن المقارنات الرئيسية تدور حول الإستراتيجيات والأهداف والغايات. 
oleg‏ ما تُسِمّى المقايبس التشغيلية المُستخدّمة لقياس «ell‏ مؤشرات الأذاء الرئيسية (KPIS)‏ 


مؤشر الأداء الرئيسي (KPI)‏ 
هناك اختلافٌ بين مقياس «تشغيل مصنع» ومقياس «الانحياز الإستراتيجي»» وغالبًا ما يُستخدّم 
شر IDIW (KPI) g l cld‏ على المصطلح الأخير (الانحياز الإستراتيجي). هثل 
ud $a‏ الرئيسي هدقًا إستراتيجيًا ويقيس الأداء مقارنة بالھدف. ووفقًا طا ذکرہ Eckerso‏ 
(2009)؛ فإن مؤشرات الأداء الرئيسة تكون متعددة الأبعاد. تحمل عدَّة ة معان» وهذا يعني ol‏ 
مؤشرات الأداء الرئيسة لها عِدَّة ة مميزات متنوعة: وتتضمّن: 
- إستراتيجية: حيث تجسّد مؤشرات الأداء الرئيسة هدقًا إستراتيجيًا. 
- أهداف: فمؤشرات الأداء الرئيسية تقوم بقياس الأداء مقارنةً بالأهداف e» 3l Boal‏ تحديد 
الأهداف à‏ الإستراتيجية أو التخطيط أو جلسات الميزانية» ويمكن أن تتخذ أشكالًا مختلفة (على 
سبيل المثال: أهداف الإنجازء وأهداف التخفيضء والأهداف المطلقة). 
- مجالات: حيث تحتوي الأهداف على مجالات أداء (على سبيل المثال: أعلى من الهدفء أو في 
صميم الهدفء أو أدنى من الهدف). 
- ترميز: حيث يتم ترميز المجالات في البرامج؛ مما يتيح العرض المرئي للأداء (على سبيل اللثال: 
الأخضرء والأصفرء والأحمر). ويمكن أن يرتكز الترميرُ على النَسَب المئوية أو القواعد الأكثر تعقيدًا. 
- الأطر الزمنية: حيث يتم تعبين أطر زمنية للأهداف التي يجب إنجازها. وكثيرا ما يتم تقسيم 
الإطار الزمني إلى فواصل زمنية أصغر؛ من أجل الحصول على نقاط ميل لمنحنى الأداء. 
- المعايير: يتم قياس الأهداف وفقًا لخط الأساسء أو المؤشر المرجعي. وغالبًا ما تكون نتائج العام 
السابق بمثابة معيارء كما يمكن أيضًا استخدام أرقام عشوائية أو مؤشرات خارجية. 
Sources: Campbell, C. (2015). Top five differences between data lakes and data warehouses. www.‏ 
blue-granite.com/blog/bid/402596/Top-Five-Differences-between-Data-Lakes-and-Data- Warehouses‏ 
(accessed July 2016); Woods, D. (2011, July). Big Data requires a big, new architecture. Forbes.www.forbes.‏ 
com/sites/ciocentral/2011/07/21/big-data-requires-a-big-new-architecture/4598623291d75 (accessed‏ 
August 2016); Dixon, J. (2010). Pentaho, Hadoop, and data lakes. James Dixon's Blog.https://jamesdixon.‏ 
wordpress.com/2010/10/14/pentaho-hadoop-and-data-lakes/(accessed August 2016); Dull, T. (2016).‏ 


Data lake vs data warehouse: Key differences. KDnuggets.com. http://www.kdnuggets.com/2015/09/data- 
lake-vs-data-warehouse-key-differences.html (accessed August 2016). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yas‏ 


الفصل الثالث 


في بعض الأحيان يتم التمييرٌ بين مؤشرات الأداء الرئيسة التي يُقصّد بها «النتائج» وتلك التي 
يُقصَد بها «الدوافع»؛ فنتائج مؤشرات الأداء الرئيسة - التي ÉL cg‏ بمؤشرات التباطؤ - تقيس 
النتائج التي وصل إليها النشاط السابق (مثل: الإيرادات). فهي في الغالب مالية بطبيعتهاء غير 
أن هذا ليس بشكل دائم. وتُحدّد دوافع مؤشرات الأداء الرئيسة - والتي تعرف أحيانًا بالمؤشرات 
الرئيسة أو محركات القيمة - الأنشطة التي لها تأثيرٌ كبيرٌ على مؤشرات الأداء الرئيسة للنتائج 
(مثل: العملاء المحتملون للمبيعات). 
ويُطلق على مؤشرات الأداء الرئيسية (12515) في بعض الدوائر أحيانًا اسم 1215 التشغيلي: 
وهو من التناقض اللغوي )2008 (Hatch,‏ وتقوم معظم المؤسسات بجمع مجموعة واسعة من 
امقاييس التشغيلية. وكما بُوحي الاسم؛ فإن هذه المقاييس تتعامل مع الأنشطة التشغيلية وأداء 
الشركة. وتُوضّح الأمثلة التالية تنوعَ مجالات التشغيل التي تغطيها هذه المقاييس: 
- أداء العميل: مقاييس لرضا العملاء. وسرعة ودقة حلّ المشكلة؛ والاحتفاظ بالعملاء. 
- أداء الخدمة: مقاييس معدلات دقة اتصال الخدمةء ومعدلات تجديد الخدمة» واتفاقيات 
مستوى الخدمة» وأداء التسليم» ومعدلات الإرجاع. 
- عمليات المبيعات: حسابات جديدة على وشك الحدوثء واجتماعات المبيعات المضمونة 
وتحويل الاستفسارات إلى العملاء المتوقعينء ومتوسط وقت إغلاق المكالمات. 
- خطة المبيعات/ التوقعات: مقاييس دقة أسعار الشراءء ونسبة الشراء إلى معدل التنفيذ. 
والكمية المحققة, ونسبة توقعات الخطة» وإجمالي العقود المغلقة. 
وسواءٌ أكان المقياسٌُ التشغيلي إستراتيجيًا أم لا؛ فإن ذلك يعتمدٌ على الشركة ومدى استخدامها 
للمقياس. وفي العديد من الحالات؛ فإن هذه المقاييس تمثل الدوافع الرئيسة للنتائج الإستراتيجية, 
فعلى سبيل ال مثال» تذكر (2008) Ùl Hatch‏ موزّع نبيذ من الدرجة المتوسطة تمّ تقليصه في 
المراحل الأولى من خلال دَمْج المورّدين وتياره من خلال دَمْج تجار التجزئة. وردًا على ذلك؛ 
قزرت التركيز على أربعة إجراءات تشغيلية: تعزيز توفر المخزون المتاح/ في الوقت المناسب» 
وقيمة الطلبات «المفتوحة» الأعلّقة والحسابات الجديدة الصافيةء وتكاليف الترقية والعائد على 
الاستثمار في التسويق. وقد كانت النتيجة الصافية لجهودها زيادة بنسبة “1١‏ في الإيرادات في 
عام واحد. ومن الواضح أن هذه المقاييس التشغيلية كانت مُحركات رئيسة. ومع ذلك؛ وكما 
E‏ مُوضّح في القسم التالي؛ فإن الشركات في كثيرٍ من الحالات» تقوم ببساطة بقياس ما هو ملائم 
مع الحدّ الأدنى مع النظر في سبب جمع البيانات. وتكون النتيجة إهداراً للوقت والجهد والمال. 


Ye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


نظام قياس الأداء: 

يُوجَد فرق بين نظام قياس الأداء ونظام إدارة الأداء؛ إذ يشتمل الأخير (نظام إدارة الأداء) على 
الأول (نظام قياس è (eII‏ نظام إدارة أداء يحتوي على نظام قياس أداء» والعكس غير صحيح. 
وإذا كنت ستسأل؛ فإن معظم الشركات اليوم تدعي أنها تمتلك نظامًا لقياس الأداء؛ ولكن ليس 
بالضرورة نظام إدارة أداءء على الرغم من أن نظام قياس الأداء لا يُستخدّم إلا قليلاً جدًاء وإن وُحد؛ 
فيكون بدون الهيكل الشامل لنظام إدارة الأداء. 

تُعَدُ أنظمة قياس الأداء الأكثر شيوعًا المُستخدّمةء هي بعض أشكل بطاقة الأداء المتوازنة 
Norton (BSC)s Kaplan ¿s‏ وتشيرُ دراسات المقارنة والاستطلاعات المختلفة إلى أن نسبة 
الشركات التي نفذت شكلًا من أشكال ©85 في وقت أو آخر تتراوح بين 0۰ إلى أكثر من 1۰ في 
أيّ مكان. وعلى الرغم من أن هناك بعض الغموض حول ما يُشكل (التوازن). غير أنه لا يُوجَد 
أدنى شك حول 235 (j£‏ ©85؛ وهما: (Norton (1996)5 Kaplan‏ واللذين ذكرا أن: «المركزية 
ممنهجية 85٥‏ هي رؤية شاملة لنظام القياس المرتبط باتجاه المنظمة الإستراتيجي. والتي تستند 
إلى أربع وجهات نظر من منظور العالمء مع تدابير مالية ذاتية» ومدعومة من قبل العملاء؛ إضافةً 
إلى مقاييس التعلّم والنمو». 


أسئلة مراجعة على القسم :٠١-‏ 

-١‏ ما هي نُظُم إدارة الأداء؟ JI gba Ilg‏ أحدها؟ 

'- ما هي السّمات المميّزة لمؤشرات SKPI‏ 

- اذكر مع التوضيح بإيجاز مجالات التشغيل الأربعة الأكثر شيوعًا ممؤشرات الأداء الرئيسية. 
ع- ما هو نظام قياس الأداء؟ وكيف يعمل؟ 


1١-٠‏ بطاقات الأداء المتوازنة: 

js‏ أوسع أنظمة إدارة الأداء شهرةً وأكثرها استخدامًا على نطاق واسع؛ هو بطاقة الأداء 
المتوازن (©85). وقد أوضح كلّ من سدامه1 وده:,210 هذه المنهجية لأول مرة في مقالهما 
ẹe\33Y ale Harvard Business Review ẹ jgåubl-‏ - وكان عنوان هذه المقالة: «بطاقة الأداء 
المتوازن: المقايبس التي تدفع الأداء». وبعد مرور بضع سنوات. وتحديدًا في عام 1997م أصدر 
هذان المؤلفان كتابًا رائدًا بعنوان - بطاقة الأداء المتوازن: ترجمة الإستراتيجية إلى فعل - والذي 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ye‏ 


الفصل الثالث 


ونَّق كيف كانت الشركات تستخدمٌ 8560 ليس فقط لتكمّل إجراءاتها المالية مع المقاييس غير 
L Sg AJU‏ لتوصيل وتنفيذ إستراتيجياتها. وعلى مدى السنوات القليلة الماضيةء أصبحت 
50 مصطاحًا عامًا يُستَخدَّم لتمثيل كل نوع من أنواع تطبيق الأداء والتنفيذ. بغض النظر 
عمًا إذا كان متوازنًا أو إستراتيجيًا. وردًا على هذا الاختلاف حول المصطلح؛ فقد أصدر كلّ من 
L3bS Nortons Kaplan‏ جديدًا في عام ١٠٠٠م,‏ بعنوان: المنظمة التي تركّز على الإستراتيجية: 
كيف تزدهر شركات بطاقات الأداء المتوازن في بيئة الأعمال الجديدة» وقد تمّ تصميم هذا الكتاب 
oley‏ التأكيد على الطبيعة الإستراتيجية لمنهجية ©85. وتبع ذلك ببضع سنوات. في «Y^ E ele‏ 
بخرائط الإستراتيجية: تحويل الأصول غير الملموسة إلى نتائج ملموسة:؛ والتي تصف عملية 
مُفصّلة لربط الأهداف الإستراتيجية بالتكتيكات والمبادرات التنفيذية. وأخيرا؛ جاء كتابهم الأخير 
The Execution Premium‏ والذي YA ele à ge‏ ویرگز على الفجوة الإستراتيجية التي 
تربط بين صياغة الإستراتيجية والتخطيط والتنفيذ التشغيلي. 


وجهات النظر الأربعة: 

تشيرٌ بطاقة النتائج المتوازنة إلى أننا ننظر إلى المنظمة من أربعة منظوراتء وهي: 
-١‏ العملاء. 
۲- العمليات المالية. 
- عمليات الأعمال الداخلية. 
ع- التعلم والنمو. 

إضافةً إلى تطوير الأغراضء والمقاييسء والأهدافء والمبادرات المتعلقة بكل منظور من هذه المنظورات» 
ويبيّن الشکل ٠١-۳‏ هذه المنظورات الأربعة وعلاقاتها المتداخلة مع رؤية ا منظمة وإستراتيجيتها. 

- منظور العملاء: أدركت فلسفاث الإدارة الحديثة الأهمية الكبيرة للتركيز على العميل ومدى 
رضاه في أي عمل تجاري. وفيما ياي المؤشرات الرئيسة لقياس ذلك؟ فالعملاء إذا لم يشعروا بالرضا؛ 
فإنهم في الواقع سوف يبحثون عن مورّدِين آخرين يمكنهم تلبية احتياجاتهم. وبالتالي؛ فإن الأداء 
الضعيف من هذا المنظور يُعَدُ مؤشرًا قويًا على التراجع في المستقبلء على الرغم من أنَّ الصورة 


à LUI‏ الحالية قد تبدو جيدةً. وفي تطوير المقاييس لتحقيق الرضا؛ ينبغي تحليل العملاء من 
حيث أنواع العملاء وأنواع العمليات التي نقدَّم لها منتجًا أو خدمةً لتلك المجموعات من العملاء. 


yy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


- المنظور امالي: لم يتجاهل كل من داه وده:.710 الاحتياجات التقليدية للبيانات المالية. 
ولذلك؛ فإنَّ الأولوية دائًا ستكون لتقديم بيانات التمويل بشكلٍ دقيق» وفي الوقت المناسبء 
وسوف يبذل المديرون كلّ ما في وسعهم لتوفير هذه البيانات. وفي الواقع؛ فإنه غالبًا ما يكون 
هناك أكثرٌ من معالجة كافية لتجهيز البيانات المالية. ومع تنفيذ قاعدة بيانات الشركات؛ فإنه 
من المنتظر أن تتمّ معالجة المزيد من البيانات المالية وبطريقة تلقائية. لكن تبقى هناك نقطة 
مهمة في هذا الأمرء وهي أن التركيرٌ الحالي على الأمور المالية يؤدي إلى الوَضْع «غير المتوازن» فيما 
يتعلق بالمناظير الأخرى. فقد تكون هناك حاجةٌ لإدراج بيانات إضافية مرتبطة بالقطاع المالي في 
هذه الفئةء مثل: بيانات تقييم المخاطر والفوائد من حيث التكلفة. 


- منظور التعلم والنمو: يهدف هذا المنظور إلى الإجابة عن سؤال «كيف سنحافظ على قدرتنا 
على التغيير والتحسين؛ من أجل تحقيق رؤيتنا؟». وهذا يتضمّن تدريب الموظفين وإدارة المعرفة 
والخصائص الثقافية للشركات المتعلقة بالتحسينات الفردية والجماعية على حَدٌَ سواء. وفي المناخ 
الحالي للتغ بر التقني السريع؛ أصبح من الضروري أن يكون العاملون في مجال المعرفة في 53 
التعلّم والتطور المستمر. ويمكن وَضْع مقاييس لتوجيه المديرين إلى تركيز الموارد المالية المخصصة 
للتدريب؛ إذ يمكنهم المساعدة أكثر. وعلى أية حال؛ فإن التعلم والنمو يشكّل الأساس الجوهري 
لنجاح أيَّ منظمة عاملة في مجال المعرفة. ويؤكد JS] «els» oi Nortons Kaplan js jS‏ 
من كونه «تدريبا؛ فهو إضافةً إلى التدريب يتضمَّن أيضًا أشياء مثل وجود ا موجّهين وا معلمين 
داخل ال منظمة؛ إضافةً إلى سهولة التواصل بين العمال؛ مما يسمح لهم بالحصول على مساعدة 
بشأن أيّ مشكلة عند الحاجة إلى ذلك. 

- منظور عملية الأعمال الداخلية: ويركّز هذا المنظور على أهمية العمليات التجارية؛ إذ 
تسمح المقايبس التي تستند إلى هذا المنظور للمديرين بمعرفة مدى جودة تشغيل عملياتهم 
ووظائفهم الداخلية» وما إذا كانت نتائجٌ هذه العمليات (أيْ: المنتجات والخدمات) تلبّي وتتجاوز 
متطلبات العملاء (المهمة). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vr‏ 


الفصل الثالث 


منظور عملية 


X الرؤية‎ 
ine a الأعمال الداخلية‎ 














شكل 18-8: أربع وجهات نظر في منهجية بطاقة النتائج المتوازنة 


معنى التوازن فى :BSC‏ 

من وجهة نظر عالية المستوى؛ فإن بطاقة الأداء المتوازن (©85) تُعَنٌ مقياسًا للأداء ومنهجية 
إدارة تساعد في ترجمة الأوضاع المالية للمؤسسة: والعملاء والعمليات الداخليةء إضافةً إلى 
أهداف التعلّم والنموٌ إلى مجموعة من المبادرات القابلة للتطبيق. وباعتبار بطاقة الأداء المتوازن 
(©85) منهجيةً للقياس؛ فقد تمّ تصميمها لتجاوز القيود المفروضة على الأنظمة التي تركّز على 
الناحية المالية. وتقوم هذه المنهجية بذلك عن طريق ترجمة رؤية المنظمة وإستاتيجيتها إلى 
مجموعة من الأهداف والتدابير والمبادرات المالية وغير المالية المترابطة. 

وتندرجٌ الأهداف غير المالية في واحدة من ثلاث وجهات نظر: 
- العميل: يُحدّد هذا الهدف كيف يجب أن تظهر المنظمة لعملائها إذا أرادت تحقيق رؤيتها. 
- عملية الأعمال الداخلية: ويُحدّد هذا الهدف العمليات التي يجبُ أن تتفوق فيها المؤسسة 


ارقا مساهميها وعملاتها: 
- التعلّم والنمو: يوضّح هذا الهدف كيف يمكن يمنظمة ما تحسين قدرتها على التغيير والتحسين؛ 
من أجل تحقيق رؤيتها. 


€ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 

















التحليلات الوصفية (*): ذكاء الأعمال ومستودعات البيانات 


وف الأساس؛ فإن الأهداف غير المالية تشكّل سلسلةٌ furw‏ بسيطة مع «التعلم والنمو»؛ مما 
يؤدي إلى تغيير «عملية العمليات التجارية الداخلية»» والتي تنتج نتائج «العميل» وا لمسؤولة 
عن تحقيق الأهداف «المالية» للشركة. وفي ©2856 ينشأ مصطاح التوازن؛ لأن مجموعة التدابير 
مجتمعة من المفترض أن تشمل المؤشرات: 
- المالية وغير المالية. 
- الرائدة والمتخلفة. 
- الداخلية والخارجية. 
- الكمية والنوعية. 
- على المدى القصير والمدى الطويل. 


أسئلة مراجعة على القسم :١١-۳‏ 

-١‏ ما هي بطاقة الأداء المتوازن S(BSC)‏ ومن أين تأتي؟ 

؟- ما هي المناظير الأربعة التي تقترحها (850) لعرض الأداء التنظيمي؟ 

was JI gbos BLL -Y‏ مقاصد ومقاييس وأهداف ومبادرات منفصلة لكل من وجهات النظر 
الأربعة هذه؟ 

ع- ما هو معنى التوازن في 8560؟ وما هو تحفيز ذلك التوازن؟ 

ه- ما هي أوجه الشبه والاختلاف بين لوحات المعلومات وبطاقات الأداء؟ 


11-7 ستة سيجما كنظام لقياس الأداء: 

منذ إنشاء ستة سيجما في منتصف الثمانينيات» وهي تتمتّع بانتشار واسع النطاق بين الشركات 
في جميع أنحاء العالم. ومن الجدير بالذكر؛ أن معظم الشركات لم تستخدمها كمنهجية قياس الأداء 
والإدارة؛ بل أستخدِمَّث بدلًا من ذلك كمنهجية لتحسين العمليات؛ إذ تمَكّن الشركات من التدقيق 
في عملياتها وتحديد المشكلات وتطبيق العلاجات. وفي السنوات الأخيرة أقرّت بعض الشركات» 
مثل 110101012 بقيمة استخدام ستة سيجما لأغراض إستراتيجية؛ إذ توفر ستة سيجما في هذه 
الحالة الوسائل لقياس ومراقبة العمليات الأساسية المتعلقة بربحية الشركة؛ وتسريع التحسّن في 
الأداء العام للأعمال. ونظرًا لتركيزها على العمليات التجارية؛ فإن ستة سيجما توفْر أيضًا طريقةً 
مباشرةً لمعالجة مشكلات الأداء بعد تحديدها أو اكتشافها. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري y.o‏ 


الفصل الثالث 


تُعرّف سيجما (6) 515702 بأنها حرف في الأبجدية اليونانية يستخدمه الإحصائيون لقياس 
التباين في العملية. وفي مجال الجودة يكون التغيّر مرادقًا لعدد العيوب. وبشكل عام؛ فقد 
قبلت الشركات قدرًا كبيرًا من التباين في عملياتها التجارية. وأما من الناحية العددية؛ فقد كان 
المعيار 717٠١‏ إلى 77٠٠١‏ عَيْبٍ (DPMO) ioè galo JSI‏ فعلى سبيل المثال: إذا كانت شركة 
تأمين تتعامل مع مليون شكوى؛ فإن إجراءات التشغيل العادية من 77٠١‏ إلى 71٠٠١‏ من هذه 
الشكاوى تَعَدٌ معيبةً (أيْ: يتم التعامل معها بشكل غير صحيح» وتحتوي على أخطاء في النماذج). 
هثل هذا امستوى من التباين مستوى أداء من ثلاثة إلى أربعة 708ع51. ولتحقيق مستوى أداء 
tSigma às‏ فإنه سيكون على الشركة تقليل عدد العيوب إلى ما لا يزيد عن ١,6‏ 1021/10. 
ولذلك؛ فإن ستة سيجما عبارة عن منهجية لإدارة الأداء تهدف إلى تقليل عدد العيوب في العمليات 
التجارية إلى أقرب ما يكون إلى الصفر من ۶۷0( قدر الإمكان. 


نموذج الأداء :DMAIC‏ 


تقع ستة سيجما على نموذج بسيط لتحسين الأداء يُعرّف .DMAIC e Lib‏ 44395 £356 
BPM g3g—è lia DMAIC‏ فكلاهما نموذج لتحسين الأعمال في حلقة مُفرّغة وهو يشمل 
خطوات تحديد وقياس وتحليل وتحسين والتحكّم في العملية. ويمكن وَصْف الخطوات على 

النحو التالي: 

-١‏ تعريف: ويُقصَّد بذلك تحديد مقاصد وأهداف وحدود نشاط التحسين. وعلى المستوى الأعلى؛ 
فإن الأهداف يُقصّد بها الأهداف الإستراتيجية للشركة. وفي ا مستويات الأدنى (مستويات 
الإدارة أو المشروع)؛ فإن الأهداف تركز على عمليات تشغيلية مُحدّدة. 

- قياس: ويُقصّد به قياسٌ النظام الحالي. بمعنى وَضْعَ مقاييس كمية من شأنها أن تُسفر 
عن بيانات صحيحة إحصائيًا؛ بحيث يمكن استخدام البيانات؟ لمراقبة التقدِّم نحو الأهداف 
المُحدّدة في الخطوة السابقة. 

“- تحليل: ويُقصّد به تحليلٌ النظام لتحديد سبل القضاء على الفجوة بين الأداء الحالي للنظام أو 
العملية والهدف المنشود. 

ع- تحسين: ويُقصّد به الشروع في إجراءات للقضاء على الفجوة من خلال إيجاد طرق لفعل 
الأشياء بشكل أفضل وأسرع وأقل تكلفة. ويتمُ ذلك باستخدام إدارة المشاريع وأدوات 
التخطيط الأخرى لتنفيذ النّهج الجديد. 


Ya‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


ه- التحكّم: adis‏ بذلك إضفاءٌ الطابع المؤسسي على النظام بعد تعديله؛ من خلال تعديل 
أنظمة التعويض والحوافز والسياسات والإجراءات» وتخطيط موارد التصنيع وموارد الميزانيات 
وتعليمات التشغيل أو أنظمة الإدارة الأخرى. 
وبالنسبة للعمليات الجديدة؛ فإن نموذج 2214177 المُستخدّم ل (التعريف» والقياس» 

والتحليلء والتصميم. والتحقيق) يُعَذُ نموذجًا تقليديً. ولذلك؛ فقد تمّ استبداله ب 221/412 

غير أن 22141077 لا يزال يُستخدّم في المقام الأول مع القضايا التشغيليةء ومع ذلك؛ فلا شيء 

بمنع تطبيق هذه المنهجيات. ففي السنوات الأخيرة» كان هناك تركيرٌ على الجمع بين منهجية 

ستة سيجما وغيرها من المنهجيات الناجحة. SL ia‏ تمَّ دمج ا منهجية المعروفة Lean eal‏ 

Lean Production sl Manufacturing‏ أو ببساطة باسم 1.632 مع ستة سيجما؛ لتحسين 

تأثيرها في إدارة الأداء. 


بطاقة الأداء المتوازن مقابل ستة سيجما: 

على الرغم من قيام الكثيرين بالجمع بين ستة سيجما وبطاقات قياس متوازنة؛ من أجل 
الحصول على حل أكثر شمولية؛ فإِنَّ بعضهم ركّز على تفضيل إحداها عاى الأخرى. وقد قدَّم 
Scorecard lax s &z a» olg iso 4LJ (US à Gupta (2006)‏ 811512655» ملخصًا جِيدًا 
للاختلافات بين بطاقة الأداء ا متوازنةء ومنهجيات ستة سيجما (انظر: الجدول ۷-۴). وباختصار؛ 
فإن الفرق الرئيس يتمثل في أنَّ 8560 تركّز على تحسين الإستراتيجية العامة؛ في حين تركز ستة 
سيجماعان تحسين العفليات: 

جدول #-/!: مقارنة بين بطاقة الأداء المتوازن وستة سيجما 
بطاقة قياس الأداء المتوازن ستة سيجما 


نظام الإدارة الإستراتيجية 


تقدّم لقطةً لأداء الأعمالء وتُحدّد التدابير التي 


تتعلّق بالعرض الطويل الأجل للأعمال n å‏ 
تدفع الآداء نحو الرّبحية 

مُصمّمة لتحديد مجموعة من القياسات التي تؤثر 
على الرّبحية 


degna jslai dali‏ وا رة نادار 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري v.v‏ 





الفصل الثالث 

بطاقة قياس الأداء المتوازن 
تُحدّد القياسات حول الرؤية والقيم 
تتمثل عمليات الإدارة الحاسمة في توضيح الرؤية/ 
الإستراتيجية» والتواصلء والتخطيطء وتحديد 
الأهداف. ومواءمة المبادرات الإستراتيجية» وتعزيز 
التغذية المرتدّة 
أرصدة العملاء والعمليات الداخلية دون دور 
polo‏ واضح المعام 
تؤكد على تحقيق كمية مبيعات مُستَهدَفة لكل 


قياس 


تؤكّد على تعلّم المديرين التنفيذيين على أساس 
التغذية المرتدّة 

تركز على النمو 

ضخمة بالنسبة للمحتوى الإستراتيجي 

نظام إدارة يتكوّن من التدابير 








ستة سيجما 
تُحدّد المساءلة عن القيادة؛ من أجل الصحة 


والرّبحية 


تشمل جميع العمليات التجارية: الإدارية 


والتشغيلية 
أرصدة الإدارة وأدوار الموظفين» وأرصدة تكاليف 
وعائدات العمليات الثقيلة 

تؤكّد على مُعدَّل التحفيز القوي لكلّ قياس؛ بغضٌ 
النظر عن تحقيق كمية المبيعات المُستَهدّفة 

تؤكّد على التعلم والابتكار على جميع المستويات 
Fla‏ على التغذية SÍA‏ ويستلزم مشاركة جميع 
الموظفين 

ترگز على تعظيم الرّبحية 


ضخمة عند التنفيذ للربحية 





نظام القياس على أساس إدارة العملية 


Source: Gupta, P. (2006). Six Sigma business scorecard, 2nd ed. New York: McGraw-Hill Professional. 


قياس الأداء الفعّال: 


يقدّم عددُ من الكتب الطرق التي تُحدّد ما إذا كانت مجموعةٌ من مقاييس الأداء جيدةً أم 
سيئة. ومن بين الصفات الأساسية التي تميّز مجموعة مقاييس الأداء الجيدة ما يلي: 
- ينبغي أن تركّز المقاييس على العوامل الرئيسية. 
- يجب أن تكون المقاييسٌ مزيجًا من الماضي والحاضر والمستقبل. 
- يجب أن ثُوازن المقاييس بين احتياجات المساهمين والموظفين والشركاء والمورّدين وأصحاب 


اللصلحة الكقرين: 


۳۰۸ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


- يجب أن تبدأ الإجراءات من الأعلى: ثم تتدفق إلى الأسفل. 
- يحتاجُ القياس أن يكون له كمية مبيعات مُستَهِدّفة (هدف يسعى إلى تحقيقه) والتي تستند 
إلى البحث والواقع وليست تعسّفية. 
كما يُلاحِظ القسم المتعلّق بمؤشرات الأداء الرئيسية أنه على الرغم من أهمية جميع هذه 
الخصائص؛ فإن المفتاح الحقيقي لنظام قياس الأداء الفعّال هو وجود إستراتيجية جيدة. فيجبٌ 
اشتقاق المقاييس من إستراتيجيات وحدة الشركات والأعمال: ومن تحليل العمليات التجارية 
الرئيسية المطلوبة لتحقيق تلك الإستراتيجيات. وبطبيعة الحال؛ فالقول أسهل من الفعل. فلو 
كانت بسيطة؛ فإن معظم المنظمات لديها بالفعل أنظمةٌ فكَّالةٌ لقياس الأداء. غير أنها لا تقوم بذلك. 
وتقدّم الحالة العملية (-1) - والتي تصف نظام بطاقة الأداء على أساس 1221 المستند 
إلى الويب على Expedia.com‏ - 6,55 ثاقبةً على الصعوبات المتعلقة بتحديد eg o. Js‏ 
ومؤشرات 521: وأهمية مواءمة مؤشرات الأداء الرئيسة للإدارات مع الأهداف العامة للشركة. 


حالة عملية 5-9 
بطاقة درجة رضا Expedia.com 5 oll Wal‏ 

isi‏ شركة 10 ,013ءم::8. هي الشركة الأم لبعض الشركات العاللية الرائدة في مجال 
السياحة؛ إذ تقدِّم خدمات السفر للمسافرين بغرض الترفيهء واممقر الرئيسي لهذه الشركة 
هو الولايات المتحدة الأمريكيةء كما أنَّ لها فروعًا أخرى في مختلف دول العالم. وهي 
تمتلك وتدير مجموعةً متنوعةً من العلامات التجارية المعروفة, ا في ذلك Expedia.‏ 
Classics .Egencias .IripAdvisors .Hotwire.coms .Hotels.coms «com‏ 
5 مومجموعة من الشركات المحلية والدولية الأخرى. وتحتوي عروض سفر 
الشركة على: رحلات شركات الطيران» والإقامة في الفنادق» واستئجار السيارات» وخدمات 
أماكن الوصولء والرحلات البحريةء ورحلات السفر التي تقدّمها مختلف شركات الطيران؛ 
إضافة إلى أماكن الإقامة: وشركات تأجير السيارات: والخدمات التي تُقدَّم في مكان 
الوصول» وخطوط الرحلات البحرية» وغيرها من شركات خدمات السياحة القائمة بذاتها 
أو التي تعمل في مجموعة. كما أنها تُسهّل حجز غرف الفنادق ومقاعد شركات الطيران 
وتأجير السيارات. وخدمات الوصول المقدّمة من الشركات السياحية. وتعمل هذه 
الشركة كوكيلٍ في الإجراءات؛ إذ تقوم بالحجز للمسافرين على شركة الطيران أو الفنادق 
أو شركات تأجير السيارات أو خطوط الرحلات. وتجعل هذه العلامات التجارية ا لمشهورة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۳۹ 


الفصل الثالث 


مع الأعمال التجارية المبتكرة من 6414م8 أكبر وكالة سفر عبر الإنترنت في العالمء وهي 
ثالث أكبر شركة سفر في الولايات المتحدة, ورابع أكبر شركة سفر في العالم. وتتمثل مهمثها 
في أن تصبح أكبرَ وأكثر شركة سياحية مريحةً في العالم؛ وذلك من خلال مساعدة الجميع 
في كل مكان في التخطيط وتوفير كلّ ما يتعلق بخدمات السياحة والسفر. 

ا لمشكلة: 

يُحَدُ رضا العملاء هو المفتاح لكلّ مهام وإستراتيجيات؛ بل وأساس نجاح شركة 
8م . ونظرًا لأن خدمة البيع بالتجزئة هي نشاطٌ تجاريٌّ عبر الإنترنت؛ فإن تجربة 
تسوق العميل تُعَدَ أمرًا بالغ الأهمية لإيرادات شركة 6013م«8؛ إذ إن تجربة التسؤّق 
عبر الإنترنت يمكنها أن تجعل النشاط التجاري عبر الإنترنت يزدهر أو ينتهيء ومن المهمٌ 
أيضًا أن تُنَوّج تجربة التسوق للعميل برحلة جيدة. ونظرًا لأن تجربة العميل تُعَدَ أمرًا 
بالغ الأهمية؛ فإنه يجبُ تتبّع جميع مشكلات العملاء ومراقبتها وحلّها في أسرع وقت 
ممكن. وللأسف؛ فقد كانت شركة 6013م:8 قبل بضع سنوات لا تستطيع الوصول إلى 
«رأي العميل». فلم يكن لديها طريقة موحّدة لقياس مدى رضا العميلء أو تحليل 
محركات الرضاء أو تحديد أثر الرضا على ربحية الشركة أو أهداف العمل العامة. 

الحل: 

م تكن مشكلة شركة 6018م<8 تتمثل في نقص البيانات. أدركت المجموعة المسئولة 
عن قياس مدى رضا العملاء في شركة 86413 أن لديها الكثير من البيانات. وبشكلٍ 
ale‏ فقد كان هناك ۲۰ قاعدة بيانات متباينة مع ٠١‏ مالكًا مختلقًا. ومن ثم قامت 
المجموعة بتكليف أحد مُحلَِي أعمالها بمهمة تجميع البيانات من هذه المصادر المختلفة 
وتجميعها في عدد من المقاييس الأساسية لقياس مدى الارتياح. وقد كان محلل الأعمال 
يقضي ما يقرب من أسبوعين إلى ثلاثة أسابيع كلّ شهر في سحب البيانات وتجميعهاء 
وهذا الأمر لم يترك وقنّا للتحليل نهائيًا. ولذلك؛ فقد أدركت المجموعة في النهاية أن 
مجرد تجميع البيانات لم يكن كافيًا؛ إذ يجب أن يُنظر إلى البيانات في سياق الأهداف 
الإستراتيجيةء وكان يجب على الأقراد أن يضعوا أيديهم على النتائج. 

و معالجة المشكلة قَرّرت المجموعة أنها بحاجة إلى رؤية راقية. ولذلك فقد بدأت 
Jais ddois‏ للدوافع الأساسية لآداء الإدارة والرابط بين هذا الأداء وأهداف 6014م1:2 
الشاملة. ثم قامت المجموعة بعد ذلك بتحويل برامج التشغيل وهذه الارتباطات إلى 
بطاقة قياس أداء. وقد تضمّنت هذه العملية ثلاث خطوات: 


۳1۰ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (7): ذكاء الأعمال ومستودعات البيانات 


-١‏ تقرير كيفية قياس مدى رضا العميل: وقد تطلَّب ذلك من المجموعة تحديد أي 
من المقايبس في قواعد البيانات العشرين سيكون مقيدًا في إظهار مستوى رضا العميل» 
وقد أصبح هذا هو الأساس لبطاقات الأداء ومؤشرات الآداء الرئيسية. 

؟- تحديد أهداق الأداء الصحيحة: وهذا يتطلب من المجموعة تحديد ما إذا 
كانت أهداف 121 لها أرباحٌ قصيرة الأجل أو طويلة الأجل؛ فمجرد رضا العميل عن 
تجربته عبر الإنترنت لا يعني بالضرورة أن العميل راض عن مُقدَّم خدمة السفر. 

“- وَضْع البيانات في السياق: فقد كان على المجموعة رَبّط البيانات بمدى رضا 
العملاء في الوقت الحالي. 

ens‏ تغذية مصادر البيانات المختلفة بشكل فوري في قاعدة بيانات رئيسية (تُسمّى 
نظام دعم القرار). وفي حالة مجموعة الاستبيانات الخاصة بمدى رضا العملاء؛ فإن هذه 
الاستبانات تتضمّن استطلاعات العملاءء وأنظمة إدارة علاقات العملاءء وأنظمة الاستجابة 
الصوتية التفاعلية. وأنظمة خدمة العملاء الأخرى. ويتمٌ تنزيل البيانات في مصنع 1055 
as: Ki‏ في صورة عِدَّةَ مكعبات 1115 متعددة الأبعاد؛ بحيث يمكن للمستخدمين 
الوصول إلى البيانات بطرق متنوعة ذات صلة باحتياجاتهم التجارية الخاصة. 

الفوائد: 

وفي نهاية المطاف استطاعت المجموعةٌ الخاصة من خلال قياس مدى رضا العملاء؛ 
أن تحقق من ٠١‏ إلى ١1'‏ هدقًا ترتبط مباشرةً بمبادرات شركة إكسبيديا. وقد تم رَنْط هذه 
الأهداف بدورها بأكثر من 200 1281 ضمن المجموعة الخاصة بقياس مدى رضا العملاء. 
يستطيع مالكو ۴1× بناء وإدارة واستهلاك بطاقات الأداء الخاصة بهم: كما ملك المديرون 
التنفيذيون ومديرو الإدارة رؤيةٌ شفافةً حول مدى توافق الإجراءات مع الإستراتيجية. كما 
توفر بطاقة النتائج للمجموعة الخاصة بقياس مدى رضا العملاء» القدرةً على التعمّق في 
البيانات التي تكمُّنُ وراء أيّ من الاتجاهات أو الأنماط الملاحظة. Ss‏ هذا كان يستغرق 
في الماضي أسابيع أو شهور للقيام به؛ وذلك إذا تم القيامُ به على الإطلاق. ويمكن لمجموعة 
خدمة العملاء معرفة مدى نجاحها في ما يتعلق بمؤشرات الأداء الرئيسية من خلال بطاقة 
«doll‏ والتي تنعكسٌ بدورها على أهداف المجموعة وأهداف الشركة. 

كما أنَّ للبيانات الموجودة في النظام ميزةً إضافية؛ فهي لا تدعم فقط مجموعة 
رضا العملاء؛ بل إنها أيضًا تدعمٌ وحدات الأعمال الأخرى في الشركة. فعلى سبيل المثال: 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YM‏ 


الفصل الثالث 


يمكن مدير الخط الأمامي filos‏ نفقات شركات الطيران Sio de Gyu JS uolui de‏ 
لتقييم أداء العقد المتفاوض عليه أو تحديد إمكانات التوفير لتوحيد الإنفاق مع شركة 
نقل واحدة. كما يكن لمدير السفر الاستفادة من ذكاء الأعمال لاكتشاف المناطق التي 
بها كميات كبيرة من التذاكر غير المستخدّمة أو الحجوزات غير المتصلة بالإنترنت وضع 
إستراتيجيات لضبط السَّلوكَ وزيادة التوفير العام. 

أسئلة للمناقشة: 

SExpedia.com as gs $— -\‏ وماذا يُعَدُ رضا العملاء جزءًا مهما جدًا من 
نشاطهم التجاري؟ 

۲- كيف ساهم نظام البيع بالتجزئة في تحسين رضا العملاء باستخدام بطاقات الأداء؟ 

'- ما هي التحَدّيات؟ وما هو Í‏ المقترح؟ وما هي النتائج التي حصلوا عليها؟ 
Sources: Based on Microsoft. (2005). Expedia: Scorecard solution helps online travel‏ 
company measure the road to greatness. download.microsoft.com/documents/‏ 
customerevidence/22483 Expedia Case Study.doc (accessed June 2016); Editor's‏ 
note.2004). Expedia incorporates customer satisfaction feedback and employee‏ 


input to enhance service and support. Quirks Marketing Research Media. http:// 
www.quirks.com/articles/a200420041001/.aspx (accessed July 2016). 


أسئلة مراجعة على القسم :١١-۳‏ 

-١‏ ما هي ستة سيجما؟ وكيف يتم استخدامُها كنظام لقياس الأداء؟ 
-٠‏ ما هو 5821410 اذكر وَصُفاً بإيجاز لخطوات ©22181. 

۳- قارن بين 88€ وستة سيجما كنظامين متنافسين لقياس الأداء. 
-٤‏ ما هي المكوّنات اللازمة لنظام فعّال لإدارة الأداء؟ 


تلخيصٌ لأهمّ نقاط الفصل: 


- يُعرّف مستودع البيانات بأنه عبارة عن مستودع بيانات تمَّ إنشاؤه بشكلٍ خاص؛ إذ يتم تنظيم 
البيانات بحيث يمكن للمستخدمين النهائيين الوصولٌ إليها بسهولة لعدَّة تطبيقات. 
- تحتوي 1215 على بيانات حول موضوع واحد (كالتسويق DM oss ol oS Es‏ 13 && 


vw‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (*): ذكاء الأعمال ومستودعات البيانات 


من مجموعة فرعية من البيانات في مستودع البيانات. وتُعَدُ 2215 ح لا أقل تكلفةً بمكن 
استبداله أو يمكن أن يكمل مستودع البيانات. كما يمكن أن تكون 5 مستقلة عن أو تعتمد 
على مستودع البيانات. 

is-‏ نظام 5 نوعًا من قاعدة بيانات ملفات معلومات العملاء التي يتم استخدامها غالبا 
كمنطقة تقسيم لمستودع البيانات. 

- يشملٌ تكاملٌ البيانات ثلاث عمليات رئيسيةء هي: الوصول إلى البيانات» واتحاد البيانات» 
والتقاط التغيير. فعندما يتم تنفيذ هذه العمليات الثلاث بشكل صحيح؛ هكن الوصول إلى 
البيانات وإتاحتها بلجموعة من 311 وأذوات التحليل بيات مستوذعات البيانات. 

- تقوم تقنیات E۲1‏ بسحب البيانات من مصادر عديدةء وتطهیرهاء وتنزیلها في مستودع بيانات. 
das ETL idg‏ متکاملة $ de ŠA garia GI‏ البيانات بشكلٍ فوري أو مستودعات البيانات 
النشطة التكميلية وتوسيع التخزين التقليدية للبيانات» والانتقال إلى مجال صُنْع القرارات 
التشغيلية والتكتيكية عن طريق تنزيل البيانات بشكل فوري وتوفير البيانات للمستخدمين 
لاتخاذ القرارات الفعّالة. 

- يد أمان البيانات والمعلومات وخصوصيتها من الأمور المهمة بالنسبة للمتخصص في مستودع البيانات. 


مصطلحات أساسية: 


بطاقة النتائج المتوازنة | نمذجة الأبعاد الاستخراج والتحويل | الخطة التشغيلية 
(BSC)‏ والتنزيل (ETL)‏ 


إدارة أداء الأغمال | 211410 سوق البيانات المستقلة | نظم قياس الأداء 
(BPM)‏ 


نات المكعب | الانتقال لأسفل شر الأداء الرئيسي | مستودعات JI‏ 
pin‏ الفورية (RDW)‏ 


سوق البيانات (284) | تكامل تطبيقات | البيانات الوصفية TEEM‏ 
الشرکات (۴۸1) 


ت |مستودع OLTP | SOL‏ مخطط مجموعة الثلج 
المؤسسة (82187) 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vw‏ 








الفصل الثالث 





مدير مستودع البيانات | تكامل معلومات | سوق أوبر المخطط النجمي 
(DWA)‏ الشركات (EII)‏ 


سوق البيانات التابع أجدول الأبعاد OLLI s a‏ 


التشغيلية (0725) 


أسئلة للمناقشة: 
-١‏ قارن بين تكامل البيانات و.811. وكيف يرتبطان بعضهما ببعض؟ 
la -Y‏ هو مستودع البيانات؟ وما هي فوائده؟ ولماذا تُعَذُ إمكانية الوصول إلى الويب مهمةً في 
مستودع البيانات؟ 
da -Y‏ 984 ل 2231 استبدالٌ مستودع البيانات أو استكماله؟ قارن وناقش هذه الخيارات. 
ع- ناقش العوامل والمزايا الرئيسة لمستودعات البيانات للمستخدمين النهائيين. 
5- اذكر أوجه الاختلافات و/ أو الشبه بين أدوار مسؤول قاعدة البيانات ومسؤول مستودع البيانات. 
1- اشرح كيف يمكن أن يؤدي تكامل البيانات إلى مستويات أعلى من جودة البيانات. 
۷- قارن بين طريقِئَيْ 11ه6د:ن1 ودهه:م1 نحو تطوير مستودع البيانات. وحدّد متى يكون jS‏ 
منها أكثر فعالية. 
8- ناقش المخاوف الأمنية المتعلقة ببناء مستودع البيانات. 
9- قم بالتحقيق في تنفيذ تطوير مستودع البيانات الحالي من خلال النقل إلى الخارج. واكتب 
تقريرًا حول هذا الموضوع. ثم ناقش مع زملائك هذه القضية من حيث الفوائد والتكاليف» 
وكذلك العوامل الاجتماعية. 
-٠‏ يستخدم 5472 مصطلح إدارة المؤسسة الإستراتيجية (5151/1): ويستخدم 0087205 مصطلح 
إدارة أداء الشركات (0221): ويستخدم Hyperion‏ مصطلح إدارة أداء الأعمال (/822). 
هل يشيرون إلى نفس الأفكار الأساسية؟ قدَّم أدلة لدعم إجابتك. 

-١‏ يشمل 881/1 خمس عمليات أساسية: وَضْع الإستراتيجية» التخطيط المراقبة, الفعل, والضبط. 
اختر إحدى هذه العمليات» وناقش أنواع أدوات البرامج والتطبيقات المتوفرة لدعمها. يُقدّم 
الشكل ٠١-*‏ بعض التلميحات. ويمكنك أيضًا الاستعانة بقائمة الأدوات المساعدة الخاصة 


(Bain & Company (bain.com /management tools /home.asp à$ 5 


ع ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


۲- اختر شركةً عامةٌ تهمك. باستخدام التقرير السنوي للشركة لعام 17١7م:‏ قم بإنشاء ثلاثة 
أهداف مالية إستراتيجية لعام ۲۰۱۷م. لكل هدفء حَذَّد هدقًا أو هدقًا إستراتيجيًا. يجب 
أن تكون الأهداف متسقة مع الأداء المالي للشركة لعام 15١م.‏ 

۳- قارن بين إدارة الأداء وقياس الأداء. 

.850 قم بإنشاء إستراتيجية لشركة افتراضية؛ وذلك باستخدام وجهات النظر الأربع من‎ -١ 
مع التعبير عن الإستراتيجية كسلسلة من الأهداف الإستراتيجية. ثم قم بِوَضْع خريطة‎ 
إستراتيجية تصوّر الروابط بين الأهداف.‎ 

4- قارن نموذج 221412 مع عمليات الحلقة المغلقة ل 821/1. 

- اختر شركتين تعرفهما جيدًا. ما هي المصطلحات التي يستخدمونها لوَضُف مبادراتهم الخاصة 
ب 8211 وتركيبات البرامج؟ ثم قارن وميّز بين عروضهم من حيث تطبيقات ووظائف BPM‏ 


تمارين: جامعة تيراداتاء والتدريبات العملية الأخرى: 

1055 على موقع‎ glibly Coca-Cola Japan بالنظر في حالة تطوير مستودع بيانات لشركة‎ -١ 
i اقرا‎ .http://dssresources.com/cases/coca-colajapan «.55Jl Js Resources 
الحالةجيدًاء وأجب عن الأسثلة التسعة لمزيدٍ من التحليل والمناقشة.‎ 

؟- اقرأ مقال الكرة )۲٠٠١(‏ وقم بترتيب المعايير (وفقًا لمنظمة حقيقية). في تقرير, اشرح مدى 
أهمية كل معيار ومماذا؟ 

“- اشرح متى يجبٌُ أن تقوم بتطبيق بنية ثنائية أو ثلاثية الطبقات عند التفكير في تطوير 
مستودع بيانات. 

ع- اقرأ حالة ontinenta1 Airlines‏ الكاملة (قصة نجاح تخزين بيانات شائعة للغاية) على 
شبكة -Teradata university.com‏ وأجب عن الأسئلة. 

Harrah اقرأ وأجب عن الأسئلة المتعلقة بحالة ”أر باح‎ teradatauniversitynetwork.com à-o 
العالية من معلومات العميل“. ثم قم بربط نتائج 113531 بما ستستخدمه شركات الطيران‎ 
والكازينوهات الأخرى في بيانات العملاء.‎ 

teradatauniversitynetwork.com à‏ اقرأً الإجابة عن أسئلة المهمة ”فشل مستودعات 
البيانات”. ونظرًا لأن ثماني حالات موصوفة في هذه المهمة؛ فيمكن تقسيم الفصل QU dl‏ 
مجموعات» مع تعيين حالة واحدة لکل مجموعة. lol‏ إلى Ariyachandra and 1j3l s&U5‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Po‏ 


الفصل الثالث 


Watson (20062)‏ وحَدّد لكلّ حالة كيف حدث الفشلٌ على أنه لا يرتبط بالتركيز على واحد 
أو أكثر من عوامل نجاح المرجع. 

Ad- ài» 4a &olaJl álz LI e caols 153l teradatauniversitynetwork.com ¥ 
استخدام نموذج التحليل التحلياي ممبيعات رععاة١†5هإء¡M». كن الوصول إلى‎ : 
برنامج '(2116105113]68 من موقع 71017. وقد ترغبُ أيضًا في استخدام العرض التقديمي‎ 
gal gbt igsi gl» MicroStrategy حول برنامج‎ Barbara Wixom 
TUN gs. Je. Lab pg% glg «MicroStrategy Tutorial 

Dlgs salà cteradatauniversitynetwork.com ($ -A‏ الویب التي تحمل عنوان: «مستودعات 
البيانات الفورية: الجيل التالي من إدارة بيانات دعم القرار» و«بناء المؤسسة بشكل فوري». 
ثم اقرأ المقالة التي بعنوان: «البنية المرجعية للمؤسسات بشكل فوري في تيراداتا: مخطط 
لمستقبل تقنية المعلومات»؛ والتي تتوفر في هذا الموقع. وقم بوصف كيفية عمل المفاهيم 
والتقنيات الفوريةء وكيف يمكن استخدامها لتوسيع نطاق مستودعات البيانات الحالي وأبنية 
ذكاء الأعمال لدعم القرارات اليومية. واكتب تقريرًا يوضّح 15 eds RDW Ql cà‏ 5:5 
تنافسيةً للمؤسسات على وجه التحديد. ثم قم بوصف الصعوبات في مثل هذه التطبيقات 
والعمليات بالتفصيلء ثم وصف كيفية معالجتها las‏ 

.teradatauniversitynetwork.com (à -‏ شاهد ندوات الويب بعنوان: «النهوض بتكامل البيانات: 
برامج التشغيل الجديدة والمقاربة الناشئة» و«البحث عن نسخة واحدة للحقيقة: إستراتيجيات 
لتدعيم الصوامع التحليلية» و«دَمْج البيانات: استخدام .8:11 و8541 و811 أدوات لإنشاء مؤسسة 
متكاملة». واقرأ أيضًا التقرير البحثي «دَمْج البيانات». قارن بين العروض التقديمية. ما هي 
القضية الأكثر أهميةً التي تمّ وصفها في هذه الحلقات الدراسية؟ وما هي أفضل طريقة للتعامل 
مع الإستراتيجيات والتحَدّيات الخاصة بتوحيد إدارة البيانات وجداول البيانات في بنية Saboh‏ 
لمستودعات البيانات؟ قم بإجراء بحث على الويب؛ للتعرّف على آخر التطورات في هذا المجال. 
ثم قارن العرض التقديمي بالمادة في النص والمادة الجديدة التي عثرت عليها. 

-٠١‏ بالنظر في مستقبل مستودعات البيانات. قم بإجراء بحث على الويب حول هذا الموضوع. أيضّاء اقرأ 
L. (2006, March 31) gaU gsls‏ ,480518. مستودعات البيانات في عام مسطح: اتجاهات 
لعام :DM Direct Newsletter; and Geiger, J. G. (2005, November). CIFe —..Y**3‏ 
تتطور مع العصر. مراجعة 21081 .٤١-۳۸‏ قارن وقارن نتائجك. 


y‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (7): ذكاء الأعمال ومستودعات البيانات 


.teradatauniversitynetwork.com |] Jeeglb - ١‏ حَذّد أحدث المقالات والتقارير البحثية 
وحالات مستودعات البيانات. مع وَصُف التطورات الأخيرة في هذا المجال. اذكر في تقريرك؛ 
كيف يتم استخدامٌ مستودعات البيانات في ذكاء الأعمال و255. 

۲- انتقل إلى 353 Teradata yb» 5» &ouls YouTube.com g‏ 851»؛ إذ تشير 851 إلى 
.“.Business Solutions Inc”‏ حَدد ثلاث حالات تخزین بیانات مثيرة للاهتمام. وشاهدها 
بعناية» واكتب تقريرًا لمناقشة النتائج التي توضّلت إليها حول مشكلات العمل واقتراحها 
الحلول الاستقصائية. 

5à7 .teradatauniversitynetwork.com |J] Jl -W'‏ نوع المحتوى «المقالات». تصفح قائمة 
«SYL ALI‏ 2325 موقعًا بعنوان: «إدارة أداء الأعمال/ الشركات: تغيير منظر البائع وأهداف 
السوق الجديدة». بناءً على المقالة. أجب عن الأسئلة التالية: 

-١‏ ما هو التركيز الأساسي للمادة؟ 

۲- ما هي «الوجبات السريعة» الرئيسة من المادة؟ 

“- في المقالة ما هي الوظيفة أو الدور التنظيمي الأكثر مشاركة بشكلٍ وثيق في SCPM‏ 

ع- ما التطبيقات التي تغطيها /021؟ 

0- كيف تشبه هذه التطبيقات أو تختلف عن التطبيقات التي تغطيها 021/1 لشركة #ع ام ©؟ 

- ما هي ©818؟ وما هي صلتها بأداء الشركة؟ 

-V‏ ما هي بعض عمليات الاستحواذ الرئيسة التي حدثت في سوق الاجتماع التحضيري للمؤتمر 
خلال العامين الماضيين؟ 

8- حَذَّد اثنتين من الشركات التي تمت مناقشتها في المقالة (وليس 58 أو (IBM sf Oracle‏ ما هي 
إستراتيجيات 0211 لكل من الشركات؟ كيف يفكر المؤلفون فيما يتعلق بهذه الإستراتيجيات؟ 

ع١-‏ انتقل إلى .teradatauniversitynetwork.com‏ 5 543 نوع المحتوى «دراسات الحالة». 
تصفح قائمة الحالاتء وَحَدَّد موقع «لوحات بيانات فورية في 10181141 51765623». وبناءً على 
هذه المقالةء أجب عن الأسئلة التالية: 

951715 ما هو‎ -١ 

5821/1 تتشابه أو تختلف بنية 7715 عن بنية‎ AS -Y 

*- ما هي أوجه التشابه والاختلاف بين عمليات الحلقة المغلقة من 881/1 والعمليات في دورة 
قرار 0024 (رَصْدء توجيه اتخاذ قرارء الفعل)؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Pw‏ 


الفصل الثالث 


ع- ما هي أنواع لوحات المعلومات الموجودة في النظام؟ هل هي تشغيلية أم تكتيكية؟ أم 
هي في الواقع بطاقات أداء؟ اشرح إجابتك. 

3Western Digital ولوحات المعلومات في‎ VIS ما هي المزايا الأساسية التي يوفرها نظام‎ -٥ 

"- ما أنواع الاستشارات التي يمكنك تقدهها إلى شركة تستعدٌ لإنشاء لوحات 7715 الخاصة بها؟ 


مهام الفريق» ومشروعات لعب الأدوار: 

-١‏ كانت ilulu go Kathryn Avery DBA‏ متاجر التجزئة على مستوى البلاد (سلسلة كبيرة) 
على مدى السنوات الست الماضية. وقد طُلب منها في الآونة الأخيرة قيادة تطوير أول 
مستودع للبيانات في سلسلة 011813 818. كان المشروع برعاية الإدارة العليا ورئيس قسم 
المعلومات. يتمثل الأساس المنطقي لتطوير مستودع البيانات في النهوض بأنظمة التقارير - لا 
سيما في المبيعات والتسويق وعلى المدى الطويل - لتحسين إدارة علاقات العملاء في السلسلة 
الكبيرة. وقد ذهبت ١رإ11ةK‏ إلى مؤتمر معهد مستودعات البيانات وكانت تقوم ببعض 
القراءة؛ لكنها لا تزال مغمورة بشأن منهجيات التطوير. إنها تعلم أن هناك مجموعتين - 
ous - 45! DMs (Kimball); EDW (Inmon)‏ تمتلكان colis‏ قوية بنفس القدر. 
في البداية؛ كانت تعتقد أن المنهجيتين مختلفتان تمامًا؛ لكن نظرًا لأنها درستهما بعناية أكثر 
فلم تكن على يقين من ذلك. لدى Kathryn‏ عددٌ من الأسئلة التي ترغب في الإجابة عنها: 
-١‏ ما هي الفروق الحقيقية بين ال منهجيات؟ 

-١‏ ما هي العوامل المهمة في اختيار منهجية معينة؟ 

- ماذا ينبغي أن تكون خطوتها التالية في التفكير في المنهجية؟ 

ساعد ١رإطاةK‏ في الإجابة عن هذه الأسئلة. (تم تعديل هذا التمرين من 
.)Duncan, K., Reeves, L., & Griffin, J. 2003, Fall‏ منظور ذكاء الأعمال الخرراء. 
-Business Intelligence Journal, 8(4), 14-19‏ 

Kumar id -Y‏ 66[ مدير مستودعات البيانات في بنك إقليمي كبير. تم تعيينه قبل 
٥‏ سنوات لتنفيذ مستودع بيانات لدعم إستاتيجية عمل CRM‏ الخاصة بالبنك. باستخدام 
مستودع البيانات؛ نجح البنك في دمج معلومات العملاء وفهم ربحية العملاء وجذب العملاء 
وتعزيز علاقات العملاءء والاحتفاظ بالعملاء. على مر السنين» اقترب مستودع بيانات البنك من 
الفورية من خلال الانتقال إلى عمليات التحديث المتكررة لمخزن البيانات. والآن؛ يريد البنك 


YA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (۲): ذكاء الأعمال ومستودعات البيانات 


تنفيذ تطبيقات الخدمة الذاتية للعملاء ومراكز الاتصال التى تتطلب بيانات أكثر عذوبةٌ مما هو 
متوفر حاليًًا في المستودع. يريد 1666 بعض الدعم في النظر في إمكانيات تقديم بيانات أعذب. 
وين أحد البدائل لذلك هو الالتزام الكامل بتنفيذ 10811. لدى مورد .8:11 استعدادٌ لمساعدته 
على إجراء هذا التغيير. ومع ذلك؛ فقد تم إبلاغ 1666 عن تقنيات ۴۸1 و۴11 ويتساءل كيف 
يمكن أن تتناسب مع خططه. وعلى وجه الخصوص يتساءل 666[ الأسئلة التالية: 

-١‏ ما هي بالضبط تقنيات 841 و811؟ 

$ETL 5 EII5 EAI يرتبط‎ às -Y 

$RDW ., EIIs EAI كيف يرتبط‎ -٠" 

JS 455 Js -€‏ من ۴۸1 و۴11 ضروریتین ل ۸0W‏ أم مکملتین لھاء أم بدیلتین عنها؟ 
ساعد 166 في الإجابة عن هذه الأسئلة. (تم تعديل هذا التمرين من 
.Brobst, S. Levy, E., & Muzilla, C. 2005,‏ تكامل تطبيقات المؤسسات 

„Journal Intelligence Journal, 10 (2), 27-33) وتكامل معلومات الشركات.‎ 

- قم بمقابلة المسؤولين في كليتك أو المسؤولين التنفيذيين في منظمتك؛ لتحديد كيف يمكن أن 
يساعدهم مستودعات البيانات في عملهم. اكتب اقتراحًا يصف نتائجك. مع تضمين تقديرات 
التكلفة والفوائد في تقريرك. 

-٤‏ راجع قائمة مخاطر مستودعات البيانات المومّحة في هذا الفصلء وابحث عن مثالين لكل منها 
في الواقع العملي. 

ه- يمكنك الوصول إلى teradata.com‏ وقراءة الأوراق البيضاء «قياس عائد استثمار مستودع 
البيانات» و«تحقيق عائد الاستثمار: إسقاط وحصاد قيمة الأعمال لمستودع بيانات الؤسسة». 
أيضًاء شاهد الدورة المستندة إلى الويب «عامل عائد الاستثمار: كيف يتعامل الممارسون 
الرائدون مع المسائل المعقدة لقياس عائد الاستثمار «DW‏ وَصِفْ أهمّ القضايا الموضّحة 
فيها. قارن هذه القضايا بعوامل النجاح الموصوفة 3( -Ariyachandra s Watson (2006a)‏ 

3 اقرأ Jul‏ بقلم Liddell Avery, K., & Watson, H. J. (2004), Fall‏ تدریب اممستخدمین 
النهائيين لمستودعات البيانات. Journal Intelligence Journal, 9 (4), 40-51 (which‏ 
.available at teradatauniversitynetwork.com)‏ فگر في الفئات المختلفة للمستخدمين 
النهائيين» قم بوَصف الصعوبات التي تواجههم» ومناقشة فوائد التدريب المناسب لكلّ 
مجموعة. اجعل كلّ عضو من أعضاء المجموعة يتولى أحد الأدوارء وقم بإجراء مناقشة حول 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري na‏ 


الفصل الثالث 


كيفية أن يكون نوعًا مناسبًا من التدريب على مستودعات البيانات مفيدًا لكلّ منكما. 

-V‏ يقدّم كلّ مورد من موردي /8821/083 تقريبًا دراسات حالة على مواقع الويب الخاصة به. باعتبارك 
فريق عمل حَدّد اثنين من هؤلاء المورّدين (يمكنك الحصول على أسمائهم من قوائم #عصامة© أو 
ò (AMR‏ قم باختيار حالتين من كلّ موقع من هذه المواقع. ولكلٌ حالة قم بإجراء ما يلي: 

-١‏ تلخيص المشكلة التي كان العميل يحاول معالجتها. 
۲- التطبيقات أو الحلول التي تم تنفيذها. 
*- الفوائد التي يتلقاها العميلٌ من النظام. 


تمارين الإنترنت: 

-١‏ ابحث في الإنترنت للعثور على معلومات حول مستودعات البيانات. حَدّد بعض مجموعات الأخبار التي 
لها اهتمامٌ بهذا المفهوم. استكشف ABI/INFORM‏ $ مكتبتك ومكتبتك الإلكترونية وعاع0ه © 
للاطلاع على المقالات الحديثة technologyevaluation.com s tdwi.org .» lj .& ssl Jae‏ 
وامموردين الرئيسيين: †era42)4.٥0١‏ و sas.c0om‏ وe.comاorac‏ وner.com.‏ تحقق j‏ من 
-db2mag.coms dssresources.com s dmreview.coms cio.com‏ 

۲- استطلع رأي بعض أدوات 1 وبعض الموردين. lul‏ مع .egain.coms fairisaac.com‏ 
glg) dmreview.com. Ll áj‏ کی الآن .(informationbuilders.com‏ 

- اتصل ببعض مورّدي مستودع البيانات» واحصل على معلومات حول منتجاتهم. أعط اهتمامًا 
خاضًا للمورّدين الذين Software A &s .Cognos : 2a .$34s:5 uale Olga gydi‏ 
-Oracles .SAS Institutes .G‏ )39 بعض هؤلاء اممورّدین عروضًا تجريبيةً مجانيةً عبر 
الإنترنت. قم بتنزيل عرض أو اثنين منها وقم بتجربتهما. اكتب تقريرًا عن تجربتك. 

ع- تصفح 6120818.6013] للتطورات وقصص النجاح حول مستودعات البيانات. اكتب تقريرًا عمًا اكتشفته. 

0- تصفّح <زه».620863]؛ بحنّا عن الأوراق البيضاء والدورات المستندة إلى الويب حول 
مستودعات البيانات. قراءة السابق ومشاهدة هذا الأخير. (قسّم الصف حتى يتم تغطية 
جميع المصادر) اكتب تقريرًا عمًا اكتشفته. 

1- قم بإيجاد حالات حديثة من تطبيقات مستودعات البيانات الناجحة. انتقل إلى مواقع مورّدي 
مستودع البيانات وابحث عن الحالات أو قصص النجاح. اختر واحدة منهاء واكتب ملخصضًا 
مختصرًا لتقدهه إلى زملائك. 


vv.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (7): ذكاء الأعمال ومستودعات البيانات 


P‏ اجع: 
Adamson, C. (2009). The star schema handbook: The complete reference to dimensional data‏ - 
warehouse design. Hoboken, NJ: Wiley.‏ 
Agosta, L. (2006, January). The data strategy adviser: The year ahead—Data warehousing trends 2006.‏ - 
DM Review, 16(1).‏ 
Ariyachandra, T., & Watson, H. (2005). Key factors in selecting a data warehouse architecture. Business‏ - 
Intelligence Journal, 10(3).‏ 
Ariyachandra, T., & Watson, H. (2006a, January). Benchmarks for BI and data warehousing success.‏ - 
DM Review, 16(1).‏ 
Ariyachandra, T., & Watson, H. (2006b). Which data warehouse architecture is most successful?‏ - 
Business Intelligence Journal, 11(1).‏ 
Ball, S. K. (2005, November 14). Do you need a data warehouse layer in your business intelligence‏ - 
architecture? informationmanagement.com/infodirect/20050916/1036931-1. html (accessed June 2016).‏ 
Basu, R. (2003, November). Challenges of real-time data warehousing. DM Review. http://www.‏ - 
information-management.com/specialreports/20031111/7684-1.html (accessed September 2016).‏ 
Benander, A., Benander, B., Fadlalla, A., & James, G. (2000, Winter). Data warehouse administration‏ - 
and management. Information Systems Management, 17(1).‏ 
Bonde, A., & Kuckuk, M. (2004, April). Real world business intelligence: The implementation‏ - 
perspective. DM Review, 14(4).‏ 
Breslin, M. (2004, Winter). Data warehousing battle of the giants: Comparing the basics of Kimball‏ - 
and Inmon models. Business Intelligence Journal, 9(1), 6-20.‏ 
-Brobst, S, Levy, & Muzilla. (2005, Spring). Enterprise application integration and enterprise‏ 
information integration. Business Intelligence Journal, 10 (3).‏ 
Brown, M. (2004, May 9-12). 8 characteristics of a successful data warehouse. Proceedings of the 29th‏ - 
Annual SAS Users Group International Conference (SUGI 29). Montreal, Canada.‏ 
Colbert, J. (2009). Performance management in turbulent times. BeyeNETWORK. http://www.b-eye-‏ - 
network.com/view/10717, (accessed September 2016).‏ 
Davison, D. (2003, November 14). Top 10 risks of offshore outsourcing. Stamford, CT META Group‏ - 
research report, now Gartner, Inc.‏ 
Dull, T. (2015). Data lake vs data warehouse: Key differences. KDnuggets.com. http://www.kdnuggets.‏ - 
com/2015/09/datalake-vs-data-warehouse-key-differences.html (accessed August 2016).‏ 
Eckerson, W. (2003, Fall). The evolution of ETL. Business Intelligence Journal, 8(4).‏ - 
Eckerson, W. (2005, April 1). Data warehouse builders advocate for different architectures. Application‏ - 
Development Trends. https://adtmag.com/articles/2005/04/01/data-warehouse-builders-advocate-for-‏ 
different-architectures.aspx (accessed September 2016).‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Tyi‏ 


الفصل الثالث 


- Eckerson, W. (2009, January). Performance management strategies: How to create and deploy effective 
metrics. TDWI Best Practices Report (accessed January 2016). https://tdwi.org/research/2009/01/bpr- 
1q-performance-management-strategies.aspx (accessed August 2016). 


- Eckerson, W., Hackathorn, R., McGivern, M., Twogood, C., & Watson, G. (2009). Data warehousing 
appliances. Business Intelligence Journal, 14(1), 40-48. 


- Edwards, M. (2003, Fall). 2003 Best Practices Awards winners: Innovators in business intelligence and 
data warehousing. Business Intelligence Journal, 8(4). 


- Elson, R., & LeClerc, R. (2005). Security and privacy concerns in the data warehouse environment. 
Business Intelligence Journal, 10(3). 


- Furtado, P. (2009). A survey of parallel and distributed data warehouses. International Journal of Data 
Warehousing and Mining, 5(2), 57-78. 


- Golfarelli, M., & Rizzi, S. (2009). Data warehouse design: Modern principles and methodologies. San 
Francisco: McGraw-Hill Osborne Media. 


- Gupta, P. (2006). Six Sigma business scorecard, 2nd ed. New York: McGraw-Hill Professional. 

- Hall, M. (2002, April 15). Seeding for data growth. Computerworld, 36(16). 

- Hammergren, T. C., & Simon, A. R. (2009). Data warehousing for dummies, 2nd ed. Hoboken, NJ: Wiley. 
- Hatch, D. (2008, January). Operational BI: Getting "real time" about performance. Intelligent Enterprise 
(accessed March 2016). http://www.intelligententerprise.com/showaArticle. jhtml?articleID-205920233 
(accessed July 2016). 

- Hicks, M. (2001, November 26). Getting pricing just right. eWeek, 18(46). 

- Hoffer, J. A., Prescott, M. B., & McFadden, F. R. (2007). Modern database management, 8th ed. Upper 
Saddle River, NJ: Prentice Hall. 

- IBM. (2009). 50 Tb data warehouse benchmark on IBM System Z. Armonk, NY: IBM Redbooks. 
Imhoff, C. (2001, May). Power up your enterprise portal. E-Business Advise. 

- Inmon, W. H. (2005). Building the data warehouse, 4th ed. New York: Wiley. 

- Jukic, N., & Lang, C. (2004, Summer). Using offshore resources to develop and support data 
warehousing applications. Business Intelligence Journal, 9(3). 

- Kalido. BP Lubricants achieves BIGS success. kalido.com/collateral/Documents/English-US/ 
CS-BP9620BIGS.pdf (accessed August 2015). 

- Kalido. BP Lubricants achieves BIGS, key IT solutions. keyitsolutions.com/asp/rptdetails/report/95/ 
cat/1175 (accessed August 2015). 

- Kaplan, R., & Norton, D. (1996). The balanced scorecard: Translating strategy into action. Boston, MA: 
Harvard University Press. 


- Kaplan, R. S., & Norton, D. P. (2005). The balanced scorecard: measures that drive performance. 


Harvard business review, 83(7), 172. 


yyy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية (؟): ذكاء الأعمال ومستودعات البيانات 


- Karacsony, K. (2006, January). ETL is a symptom of the problem, not the solution. DM Review, 16(1). 
- Kay, R. (2005, September 19). EI. Computerworld, 39(38). 
- Kelly, C. (2001, June 14). Calculating data warehousing ROI. SearchSQLServer.com. 


- Manglik, A., & Mehra, V. (2005, Winter). Extending enterprise BI capabilities: New patterns for data 
integration.” Business Intelligence Journal, 10(1). 


- Matney, D. (2003, Spring). End-user support strategy. Business Intelligence Journal, 8(3). 


- Mehra, V. (2005, Summer). Building a metadata-driven enterprise: A holistic approach. Business 
Intelligence Journal, 10(3). 

- Moseley, M. (2009). Eliminating data warehouse pressures with master data services and SOA. Business 
Intelligence Journal, 14(2), 33-43. 


- Murtaza, A. (1998, Fall). A framework for developing enterprise data warehouses. Information Systems 
Management, 15(4). Nash, K. S. (2002, July). Chemical reaction. Baseline. Issue 8, 27-36. 


- Orovic, V. (2003, June). To do & not to do. eAI Journal. pp. 37-43. 


-Parzinger, M. J, & Frolick, M. N. (2001, July). Creating competitive advantage through data 
warehousing. Information Strategy, 17(4). 


- Romero, O., & Abelló, A. (2009). A survey of multidimensional modeling methodologies. International 
Journal of Data Warehousing and Mining, 5(2), 1-24. 


- Rosenberg, A. (2006, Quarter 1). Improving query performance in data warehouses. Business 
Intelligence Journal, 11(1). 


- Russom, P. (2009). Next generation data warehouse platforms. TDWI best practices report.tdwi.org/ 
research/reportseries/reports.aspx? pid—-842 (accessed January 2016). 


- Sen, A. (2004, April). Metadata management: Past, present and future. Decision Support Systems, 
37(1). 


- Sen, A., & Sinha, P. (2005). A comparison of data warehousing methodologies. Communications of 
the ACM, 48(3). 


- Simons, R. (2002). Performance measurement and control systems for implementing strategy. Upper 
Saddle River, NJ: Prentice Hall. 


- Slywotzky, A. J., & Weber, K. (2007). The Upside: The 7 strategies for turning big threats into growth 
breakthroughs. Crown Business. 


- Solomon, M. (2005, Winter). Ensuring a successful data warehouse initiative. Information Systems 
Management Journal. 22(1), 26-36. 


- Songini, M. L. (2004, February 2). ETL quickstudy. Computerworld, 38(5). 


- Thornton, M. (2002, March 18). What about security? The most common, but unwarranted, objection 
to hosted data warehouses. DM Review, 12(3), 30-43. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري rrr‏ 


الفصل الثالث 


- Thornton, M., & Lampa, M. (2002). Hosted data warehouse. Journal of Data Warehousing, 7(2), 27-34. 
- Van den Hoven, J. (1998). Data marts: Plan big, build small. Information Systems Management, 15(1). 
- Watson, H. J. (2002). Recent developments in data warehousing. Communications of the ACM, 8(1). 


- Watson, H. J., Goodhue, D. L., & Wixom, B. H. (2002). The benefits of data warehousing: Why some 
organizations realize exceptional payoffs. Information & Management, 39. 


- Watson, H., Gerard, J., Gonzalez, L., Haywood, M., & Fenton, D.(1999). Data warehouse failures: Case 
studies and findings. Journal of Data Warehousing, 4(1). 


- Zhao, X. (2005, October 7). Meta data management maturity model. DM Direct Newsletter. 


ré‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل الرابع 
التحليلات التنبؤية )١(‏ 
عملية» وطرقء وخوارزميات التنقيب في البيانات 


أهداف التعلم: 
- تعريف التنقيب في البيانات كتقنية مكينية لتحليلات الأعمال. 
- فهم أهداف وفوائد التنقيب في البيانات. 
- الدراية الكاملة بمجموعة واسعة من تطبيقات التنقيب في البيانات. 
- تعلّم غمليات التنقيب في البيانات القياسية. 
- تعلّم أساليب وخوارزميات مختلفة من التنقيب في البيانات. 
- بناء الوعي بأدوات البرامج الحالية للتنقيب في البيانات. 
- فهم قضايا الخصوصية ومشكلات وخرافات التنقيب في البيانات. 

بصفة عامة؛ يُعَدُ التنقيب في البيانات طريقةً لتطوير المعلومات الاستخبارية Gİ)‏ المعلومات 
أو المعرفة القابلة للتطبيق) من البيانات التي تُعنى المنظمة بجمعها وتنظيمها وتخزينها. 
وتستخدمٌ المنظمات مجموعةً واسعةً من تقنيات التنقيب في البيانات للحصول على فهم أفضل 
لعملائها ولعملياتها ولحل المشكلات التنظيمية المعقدة. وندرس في هذا الفصل عملية التنقيب في 
البيانات كتقنية تمكينية لتحليلات الأعمال والتحليلات التنبؤية, والتعرّف على العمليات القياسية 
لإجراء WO TR‏ في البيانات» وفهم وبناء الخبرات في استخدام تقنيات التنقيب في البيانات 
الرئيسة: وتطوير الوعي بأدوات البرامج ا موجودةء واستكشاف قضايا الخصوصية والخرافات 
الشائعة وا مشكلات التي ترتبط غالبا بالتنقيب في البيانات. 


V-€‏ مقال افتتاحي: قسم شرطة ميامي ديد يستخدم التحليلات التنبؤية؛ 
للتنبؤ بالجريمة ومكافحتها: 

أصبحت التحليلات التنبؤية والتنقيب في البيانات جزءًا لا يتجزأ من العديد من وكالات إنفاذ 
القانون, بما في ذلك إدارة شرطة ميامي ديد والتي لا تقتصر مهمتها على حماية أمن أكبر مقاطعة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Fro‏ 


الفصل الرابع 


في فلوري دا التي تضم ۲,١‏ مليون مواطن (مما يجعلها سابع أكبر ولاية في الولايات ام متحدة)» 
ولكن أيضًا لتوفير مناخ آمنٍ وجذاب لملايين السياح الذين يأتون من جميع أنحاء العالم للاستمتاع 
بالجمال الطبيعي للمقاطعة: وكذلك المناخ الدافئء والشواطن الخلابة. ومع إنقاق السياح ما 
يقرب من ٠١‏ مليار دولار أمريي كلَّ عام وضخٌ ما يقرب من ثلث ضرائب المبيعات في فلوريدا؛ 
فمن الصعب المبالغة في أهمية السياحة في اقتصاد المنطقة. وعلى الرغم من أن قلةً من ضباط 
الشرطة في المقاطعة من المرجّح أن يدرجوا التنمية الاقتصادية في وَضْف وظائفهم؛ فإن كلهم 
تقريبًا يدركون العلاقة الوثيقة بين الشوارع الآمنة والازدهار الذي تحرّكه السياحة في المنطقة. 

ونْعَدٌ هذه القضية ذات أهمية قصوى بالنسبة للملازم أرنولد بالمرء الذي يشرف حاليًا على 
قسم التحقيقات في FEDES‏ السابق على تفاصيل التدخل في قضايا السرقة في الإدارة. 
إذ يركز هذا الفريق المتخصّص من المحققين بشكل مُكتَّف على مراقبة النقاط الساخنة للسرقة 
بالمقاطعة وأسوأ المخالفين. ويحتل هو وفريقه مكاتب متواضعة في الطابق الثاني من مبنى 
خرساني حديث ال مظهر متفرّع من شارع مُحاط بالنخيل على الطرف الغربي من ميامي. وقد شهد 
بالمر الكثير من التغييرات في السنوات العشر التي قضاها في الوحدة, من أصل 7 عامًا في القوة. 
ولا يقتصر الأمرٌ على ممارسات الشرطة: مثل الطريقة التي استخدمها فريقه في تحديد المواقع 
الساخنة لجرائم الشوارع باستخدام دبابيس ملوّنة على خريطة. 


تقليص خدمات الشرطة: 

وشهد بالمر وفريقه أيضًا تأثير تزايد عدد السكانء وتحؤل التركيبات السكانية: والاقتصاد المتغير في 
الشوارع المخولون بحراستها. ومثل أيّ قوة شرطة جيدة؛ قاموا بتعديل أساليبهم وممارساتهم باستمرار؛ 
لمواجهة تحَدَّي الشرطة الذي اتسع نطاقه وازداد تعقيده. ولكن على غرار جميع فروع حكومة 
المقاطعة تقريبً؛ فإن ضغوط الموازنة المتزايدة وضعت الإدارة في حالة ضغط بين الطلبات المتزايدة 
($a eJ dad atla is‏ اللحققين كمقائلين:ف خط اللواجهة شه موجة متضاعدة هن 
جرائم الشوارع والاحتمالات المرتقبة لموارد متشددة: «كان التحَدِّي الأساسي الذي واجهناه؛ هو كيفية 
الحَدَّ من جرائم الشوارع حتى في الوقت الذي تسببت فيه الموارد المحدودة في تقليص عدد رجال 
الشرطة في الشارع». كان الفريق على مَرٌّ السنين مُصرّخًَا له بتجربة أدوات جديدة: كان أبرزها برنامجاً 
أطلق عليه «الإنفاذ القائم على التحليلات»» والذي استخدم بيانات تاريخ الجرهة كأساس لتعيين فرق 
التحقيق. ويضيف با مر: «لقد تطؤرنا كثيرا منذ ذلك الحين في قدرتنا على التنبق بالمكان الذي يمكن أن 
يحدث فيه سرقة؛ وذلك من خلال كلّ من استخدام التحليل وتجربتنا الجماعية الخاصة». 


1 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): عملية» وطرقء وخوارزميات التنقيب في البيانات 


التفكير الجديد في الحالات الباردة: 


يتمثل التحَدَّي الأكثر إرباكًا لبالمر وفريقه من المحققين في إغلاق الحالات الأصعب» وهو تحَدّ 
مشترك مع الشرطة في جميع ال مناطق الحضرية الرئيسة؛ إذ يفتقرٌ إلى الأدلة أو الشهود أو الفيديو 
(أيّ: الحقائق أو الأدلة التي يكن أن تساعد في J‏ قضية ما). يقول با مر: «الأمرٌ ليس مفاجنًا؛ 
لأن الممارسات القياسية التي استخدمناها في توليد العملاء المحتملين» مثل: التحدّث إلى المخبرين 
أو المجتمع أو ضباط الدوريات؛ م تتغيّر كثيرا. على JS‏ حالء يعمل هذا النهج بشكلٍ جيد؛ لكن 
أحد عيوبه أنه يعتمد de KiS‏ خبرات محققينا. فإذا تقاعد هؤلاء ا محققون أو انتقلوا إلى أعمالٍ 
أخرى؛ فإن هذه الخبرات تذهب معهم». 

كان لغرٌ بالمر هو أن معدل الدوران - بسبب تقاعد العديد من المحققين الأكثر خبرةً لديه - 
كان في اتجاه تصاعدي. وتوصّل إلى أنَّ حلّ هذا اللغز يكمُنُ في ضَحَّ دماء جديدة من محققين 
أصغر سنا فهم أيضًا يجيدون التعامل مع أنواع المعلومات الجديدة - كرسائل البريد الإلكتروني» 
ووسائل الإعلام الاجتماعيةء وكاميرات المرورء على سبيل المثال لا الحصر - وذلك مِكّنه أيضًا من 
الوصول السريع إليها. ولكن كما يقول بالمر: «جاءت المشكلة عندما تحؤّلت مجموعةٌ من 
المحققين الجُدُّد الذين جاءوا إلى الوحدة للبحث عن توجيهات من كبار الضباط. في هذه المرحلة 
فقط تأكدنا أننا بحاجة إلى طريقة مختلفة لملء فجوة الخبرة في المستقبل». 

وقد أذّتَ جهودٌ بالمر المنصبّة على التفكير في Je‏ لهذا اللغز؛ إلى التوضّل إلى ما يُسمّى تكهّنات 
السماء الزرقاء. فماذا لو أن المحققين الجدد في الفرقة يمكن أن يطرحوا نفس الأسئلة على قاعدة بيانات 
الحاسبء كما لو كانوا مخبرًا مخضرمًَا؟ زرعت هذه المضاربة في عقل با مر عددًا لا نهائيًا من الأفكار. 


الصورة الكبيرة تبدأ صغيرة: 

أظهر ما كان يتبلور داخل وحدة كشف جرائم السرقة» كيف يمكن للأفكار الكبيرة أن تأت من 
أماكن صغيرة. ولكن الأهم من ذلك؛ هو أنه تبيّن أنه لكي تصل هذه الأفكار إلى مرحلة الثبات؛ 
يجب أن تكون الشروط «الصحيحة» متوافقةً في الوقت المناسب. فعلى مستوى القيادة؛ فإن 
ذلك يعني أن الشخصية القيادية في المنظمة هي التي تعرف ما يتطلبه الأمر من أجل تغذية 
الدعم من أعلى إلى أسفل؛ فضلًا عن استقاء المعلومات الذكائية كذلك من أسفل إلى أعلى داخل 
الهيكل التنظيمي. كان هذا الشخص هو بالمر نفسه. على المستوى التنظيمي؛ CÉG‏ وحدة 
جرائم السرقة نقطة انطلاق جيدة بشكلٍ خاص لنمذجة المبادرة؛ بسبب قيام بعض الجُناة بتكرار 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vvv‏ 


الفصل الرابع 


جرائمهم. وفي النهاية؛ فإن قدرة الإدارة على إطلاق العنان للقدرة التحويلية الأوسع نطاقًا لنمذجة 
المبادرة ستعتمدٌ إلى حَنَّ كبير على قدرة الفريق على تحقيق النتائج على نطاق أصغر. 

عندما أثبتت الاختباراتٌ المبكرة والعروض التوضيحية أنها مشجعةٌ - رغم أن النموذج لم يُعط 
Aio eil‏ إلا عندما تم تغذيته بتفاصيل الحالات التي تمّ حلّها - بدأ الفريق في جذب الانتباه. 
وقد تلقّت المبادرة دفعة قويةًٌ عندما عبر مسؤولو وحدة شرطة السرقة عن دعمهم لاتجاه 
المشروع: وقالوا لبالمر: «إذا استطعت القيام بهذا العملء فافعل». ولكن الأهم من التشجيع - 
كما يُوضُّح بالمر - هو استعدادهم للدفاع عن المشروع بين الأقسام الأعلى في الإدارة. يقول با مر: 
ST k»‏ لأترك المشروع على الأرض إذا لم يباركه كبار الضباط؛ لذلك كان دعمهم حاسكًا». 


النجاح يجلبٌ المصداقية: 


بعد تعيين المسؤول الرّسمي للاتصال بين تقنية المعلومات ووحدة مكافحة السرقة؛ شرّع بالمر 
في تعزيز أداة نمذجة المبادرة - والتي يُطلّق عليها الآن رسميًا ۲۸18 glo Jed oa Blue‏ 
النمذجة الرائدة في التحليلات التنبؤية - من خلال تحقيق العديد من النجاحات المتوالية. لم 
يكن أنصاره من كبار الضباط فحسب؛ بل Lá‏ هؤلاء المحققون الذين سيكون دعمهم حاسمًا في 
تبنيه بنجاح كأداة لمكافحة السرقة. وقد فوبل با مر عند محاولته تقديم ۶۸108 ں81 مقاومة 
عنيفة من قبل المحققين القدامىء الذين لم يكن لديهم أي مبرر للتخَلي عن ممارساتهم القديمة. 
وهنا أدرك بالمر أنَّ الإملاء أو الإكراه لن يجعله ينال وُدّهم وبالتالي ولا دعمهم. ولذا سيحتاج إلى 
بناء جسر من المصداقية. 

وجد با مر تلك الفرصة في واحدِ من أفضل المحققين لديه وأكثرهم خبرةً. في وقت مبكر من 
التحقي ق في السرقة؛ أشار المحقق إلى بالمر أنه كان لديه حدسٌ قوي بمرتكب الجريمة المطلوب 
ضبطه بالأساسء لاختبار flig Blue PALMS plis‏ على طلب ال محقق؛ قام محلل القسم بتغذية 
النظام بالتفاصيل الرئيسة للجريمة: بما في ذلك طريقة التشغيل. وقامت النماذجٌ الإحصائية 
للنظام بالمقارنة بين هذه التفاصيل وقاعدة البيانات التاريخية للبيانات؛ وذلك بحنًا عن ارتباطات 
وأوجه تشابه مهمة في تحديد هوية المجرم. وقد تضمَّن التقرير الذي صدر عن العملية قائمةٌ 
تضم ٠١‏ مشتبهًا تم ترتيبهم حسب ترتيب قوة الجرهة أو احتمال حدوثها. وعندما قام اللحلل 
بتسليم التقرير للمحقق؛ كان المشتبه فيه ضمن المراكز الخمسة الأولى. وبعد فترة وجيزة من 
اعتقاله؛ اعترف. واكتسب بال مر أرضًا صلبةً لمشروعه. 


YYA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عملية» وطرق» وخوارزميات التنقيب في البيانات 


على الرغم من أنه كان تمرينًا مفيدًا؛ فقد أدرك باهر أن الاختبار الحقيقي م يكن في تأكيد الحدس؛ 
ولكن في كسر الحالات التي وصلت إلى طريق مسدود. وعلى حَنَّ تعبير بالمر: «كان هذا هو الوضع 
في Ba‏ السيارات» إذ لاقهوه ولا فيديو ولا مسرح جرية». عندما قام المخبرٌ الأقدم في القضية 
المتوقفة بإجازة بعد ثلاثة أشهر؛ طلب المخبرٌ الصغير الذي تمَّ تعيينه له تقرير PALMS‏ 6نا81. وتم 
عرص صور لأشخاص ذوي حيثية في قائمة المشتبه فيهم» وقام الضحايا بتحديد هوية المشتبه فيه 
بشكلٍ دقيق؛ مما أدى إلى ختام ناجح للقضية. وكان هذا المشتبه فيه رقم واحد في القائمة. 


الحقائق فقط: 

لقد تمخّض النجاحٌ المتواصل Blue PALMS J‏ عن نجاح با مر في استقطاب المحققين إلى aio‏ 
ولكن إذا كان هناك جزءٌ من رسالته يَلقى مزيدًا من الصدى لدى المحققين التابعين له؛ فإن الحقيقة 
هي أنه قد تمّ مراعاة عدم تغيير أساسيات ممارسات الشرطة عند تصميم 81.15 6ناا8؛ بل أكثر 
من ذلك فقد تمّ تحسينها من خلال مَنْحهِم فرصةً ثانيةً لتفنيد مزاعمهم تلك بعدم قدرتهم على 
مجابهة التطورات الحديثة. يقول بالمر: «إنَّ عمل الشرطة هو جوهرٌ العلاقات الإنسانية - من 
حيث التحدّث مع الشهود. مع الضحاياء مع المجتمع - ونحن لسنا على استعداد لتغيير ذلك؛ بل إن 
هدفنا هو مَنّح الباحثين إحصاءات واقعية من المعلومات التي لدينا بالفعل والتي قد تُحدث فرقًا؛ 
لذا حتى لو نجحنا بنسبة 0* من الوقت؛ فسوف نأخذ الكثير من المذنبين من الشارع». 

لقد ساعدت القائمة المتزايدة للحالات الباردة التي حلَّها بالمر في جهوده لتعزيز Blue blja‏ 
SAL of Lebl È óI -PALMS‏ ولاؤه؛ فهو يرى أن المحققين الذين أغلقوا هذه الحالات 
الباردة - وليس البرنامج - أنهم يستحقون مزيدًا من تسليط الضوء عليهم» وقد أت ذلك النَهْج 
بثماره كما خطط له بامر. وبناءَ على طلب رئيسه. بدأ با مر في إجراء اتصالاته كمنصة للوصول 
إلى مناطق أخرى في إدارة شرطة ميامي ديد. 
شوارع أكثر أمانًا تعني مدينةً أكثر أناقةٌ: 

عندما يتحدث عن تأثير السياحة؛ وهي مؤشرٌ ترابط تد من خلال رؤية مدن ميامي ديد 
الأكثر ذكاءَّ ينظر بالمر إلى e Blue PALMS‏ أنها أداةٌ مهمة لحماية أحد أعظم أصول المقاطعة. 
يقول با مر: «كان التهديد للسياحة بسبب تزايد الجرائم في الشوارع سببًا رئيس ا في تأسيس 
الوحدة». ويضيف: «إن حقيقة قدرتنا على استخدام التحليلات والذكاء لمساعدتنا في إغلاق 
المزيد من القضايا وإخلاء الشوارع من المجرمينء هو خبرٌ سار لمواطنينا ولصناعة السياحة لدينا». 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yya‏ 


الفصل الرابع 


ماذا يُمكننا أن نتعلّم من هذه المقالة القصيرة؟ 

تتعرّض هيئات وإدارات تطبيق القانون لضغوط هائلة لتنفيذ مهمتها المتمثلة في حماية الأشخاص 
ذوي ا موارد المحدودة. ÓI‏ البيئة التي يؤدون فيها واجباتهم تصبح أكثر تحديًا على نحو متزايد؛ 
بحيث يتعيّن عليهم أن يتخذوا باستمرار موقعًا في قلب الحدث وربما يبقون على بُعْد خطوات قليلة 
مع احتمال وقوع كوارث. وهثل فهم الطبيعة المتغيرة للجرهة وا مجرمين تحديًا مستمرًا. ففي 
خضمٌ هذه التخدّيات؛ يعمل توقر'البيانات وتقئيات:القخليلات: من أجل :فخليل الأخذاث الماضية 
بشكل أفضل والتنبؤ بالأحداث المستقبلية» ويصبٌ ذلك كله في صالح هذه الوكالات. 

وقد أصبحت البيانات متاحةً أكثر مما كانت عليه في الماضي. وبالتالي؛ فإن تطبيق أدوات 
التحليل المتطوّرة وأدوات التنقيب في البيانات (أيْ: تقنيات اكتشاف المعرفة) على هذه المصادر 
الضخمة والغنية بالبيانات يوفر لهم الرؤية التي يحتاجون إليها لتحضير وتنفيذ واجباتهم بشكلٍ 
أفضل. وبذلك تكون وكالات تطبيق القانون من أهمٌ المستخدمين للوجه الجديد للتحليلات؛ 
إذ يُعَذّ التنقيب في البيانات مرشحًا أساسيًا لفهم أفضل وإدارة أقوى Bla‏ الحسَّاسة فضلًا عن 
مستوى عالٍ من الدقة والتوقيت المناسب. وتوضّح الدراسة المعروضة في المقالة القصيرة الافتتاحية 
بوضوح قوة التحليلات والتنقيب في البيانات لتوفير رؤية شاملة لعالم الجريمة والمجرمين؛ من أجل 
تفاعل وإدارة أفضل وأسرع. وسنعرض في هذا الفصل مجموعةً واسعةً من تطبيقات التنقيب 
في البيانات التي تقدّم حلولًا للمشكلات المعقدة في مجموعة متنوعة من الصناعات والإعدادات 
التنظيمية؛ إذ يتمُ استخدام البيانات للحصول على رؤية قابلة للتطبيق بغرض تحسين جاهزية 
المهمة ورفع الكفاءة التشغيلية وتحقيق الليزة التنافسية. 
أسئلة مراجعة على المقالة الافتتاحية: 
-١‏ بلاذا تتبَنّى وكالات تطبيق القانون والإدارات» مثل إدارة شرطة ميامي ديد التحليلات المتقدمة 

والتنقيب في البيانات؟ 
-Y‏ ما هي أهمُ التحَدّيات التي تواجه وكالات تطبيق القانون والإدارات» مثل إدارة شرطة ميامي 


ديد؟ هل بمكنك التفكير في تحَدَّيات أخرى (غير مذكورة في هذه الحالة) يمكنها الاستفادة 
من التنقيب في البيانات؟ 


۳- ما هي مصادرٌ البيانات التي تستخدمها وكالات تطبيق القانون والإدارات» مثل إدارة شرطة 
ميامي ديد لمشاريعها المتعلقة بكلّ من النمذجة التنبؤية والتنقيب في البيانات؟ 


كرا ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عمليةء وطرقء وخوارزميات التنقيب في البيانات 


ع- ما نوع التحليلات التي تستخدمها وكالات تطبيق القانون والإدارات» مثل إدارة شرطة ميامي 
ديد ممحاربة الجرهة؟ 
-٥‏ ماذا تعني «الصورة الكبيرة تبدأ صغيرة» في هذه الحالة؟ اشرح. 


y-t‏ مفاهيم وتطبيقات التنقيب في البيانات: 

لقد أصبحت عملية التنقيب في البيانات - وهي تقنيةٌ جديدةٌ ومثيرةٌ لم تظهر إلا منذ بضع 
سنوات فقط - عمليةً شائعةً تمارسها أكثر المنظمات. وفي مقابلة أجرتها مجلة Computerworld‏ 
مع الدكتور 2622135 4130 (الحائز على جائزة نوبل وعالم سابق في مختبرات 8611) في يناير 
5م قام الدكتور 4:20 بتحديد البيانات المُستخرّجة من القواعد التنظيمية باعتبارها تطبيقًا 
رئيسا للشركات في المستقبل القريب. de Is‏ سؤال قدیم طرحته جريدة Computerworld‏ 
حول «ما هي التطبيقات القاتلة في الشركة؟» أجاب الدكتور 2682135 بقوله: «التنقيبُ في 
البيانات». وأردف قائلاه «سوف تصبح عملية التنقيب في البيانات أكثر أهميةً. ولن تضطر 
الشركات للتخلص من آي شيءِ يتعلق بعملائهم؛ لأن ذلك سيكون ذا قيمة كبيرة. وإذا لم تفعل 
ذلك فأنت خارج العمل». وبا مثل فقد ناقش (2006) à £3 JUs à Thomas Davenport‏ 
ca» ob Harvard Business Review‏ سلاح إستراتيجي للشركات هو اتخاذ القرار التحليلي» 
وقدَّم Marriott Internationals .Capital Ones Amazon.com :JJ2s c5 ,2J All‏ وغيرها 
من الشركات التي استخدمت التحليلات؛ لفهم عملائها بشكلٍ أفضل وتحسين سلاسل التوريد 
الموسّعة لزيادة عوائدهم على الاستثمار إلى أقصى حَدَّ مع توفير أفضل خدمة للعملاء. حيث 
يعتمدٌ هذا المستوى من النجاح بشكل كبير على فهم الشركة لعملائهاء وللموردينء وللعمليات 
التجارية؛ إضافةٌ إلى فهمها لسلسلة التوريد الممتدة بشكلٍ جيد. 

ومن الممكن أن يأتي جزءٌ كبيرٌ من «فهم العميل» من خلال تحليل كمية البيانات الهائلة 
التي تجمعها الشركة. والجديرٌ o SINL‏ تكلفة تخزين ومعالجة البيانات قد انخفضت بشكلٍ 
كبيرٍ في الماضي القريب. ونتيجةً لذلك؛ فقد ممت كمية البيانات المخرَّنة في شكلٍ إلكتروني بمعدل 


Sources: Miami-Dade Police Department: Predictive modeling pinpoints likely suspects based on 
common crime signatures of previous crimes, IBM Customer Case Studies, www-03.ibm.com/software/ 
businesscasestudies/om/en/corp?synkey-C894638H25952N07; Law Enforcement Analytics: Intelligence- 


Led and Predictive Policing by Information Builder www.informationbuilders.com/solutions/gov-lea 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yri‏ 


الفصل الرابع 


هائل. ومع إنشاء قواعد بيانات كبيرة؛ فقد ظهرت إمكانية تحليل البيانات المخرّنة فيها. وقد 
كان مصطلح التنقيب في البيانات يُستخدّم في الأصل لوَضْف العملية التي يتم من خلالها اكتشاف 
أنماط غير معروفة مسبقًا في البيانات. ومنذ ذلك الحين؛ فقد امتدَّ تجاوز هذا التعريف تلك 
الحدود من قبل بعض مُورّدي البرامج ليشمل معظم أشكال تحليل البيانات؛ من أجل زيادة 
المبيعات بشعبية تسمية التنقيب في البيانات. وفي هذا الفصل؛ فإننا نوافق على أن نقبل التعريف 
الأصلي للتنقيب في البيانات. 

وعلى الرغم من أن مصطلح التنقيب في البيانات هو مصطلحٌ جديدٌ نسبيًا؛ فنَّ الأفكار التي 
وراءه ليست جديدة؛ إذ تعود جذور العديد من التقنيات المُستخدّمة في التنقيب في البيانات إلى 
التحليل الإحصائي التقليدي والذكاء الاصطناعي منذ أوائل الثمانينيات. فلماذا إِذَا استحوذت على 
اهتمام عام الأعمال؟ فيما يلي بعض الأسباب الأكثر وضوحًا: 
- زيادة Bie‏ المنافسة على النطاق العالمي تقودها الاحتياجات المتغيرة باستمرار للعملاء وما 

يريدونه في سوق مُشبع بشکل متزاید. 

- الاعتراف العام بالقيمة غير المستغلة المخفية في مصادر البيانات الكبيرة. 
- توحيد وتكامل سجلات قاعدة البيانات؛ مما يتبح رؤيةٌ واحدة للعملاء والمورّدينء وابمعاملات» وما إلى ذلك. 
- توحيد قواعد البيانات ومستودعات البيانات الأخرى في مكانٍ واحد في شكل مستودع البيانات. 
- الزيادة المتسارعة في تقنيات معالجة ومستودعات البيانات. 
- انخفاض كبير في تكلفة الأجهزة والبرمجيات لمستودعات البيانات ومعالجتها. 
- التحرّك نحو عملية الإزالة (تحويل موارد المعلومات إلى شكلٍ غير مادى) من الممارسات التجارية. 

وجديرٌ بالذكر أنَّ البيانات التي يُولّدها الإنترنت تتزايدٌ بسرعة؛ من حيث الحجم والتعقيد. 
وقد تمّ إنشاءً كميات كبيرة من البيانات الجينومية» والتي تراكمت في جميع أنحاء العالم. وهناك 
العديد من التخصّصات التي تنتج كميات هائلةً من البيانات على أساس منتظم. ولذلك يقوم 
الباحثون في ا مجال الطبي والمستحضرات الصيدلانية بإنتاج مستودعات البيانات التي يمكن 
استخدامها بعد ذلك في تطبيقات التنقيب في البيانات؛ لتحديد أفضل الطرق لتشخيص ومعالجة 
الأمراض بشكل دقيق» واكتشاف عقاقير جديدة ومُحسَنة. 

وعلى الجانب التجاري؛ فإن أكثر القطاعات التي تستخدم تقنية التنقيب في البيانات» 
تتمثل في قطاعات التمويلء والبيع بالتجزئةء والرعاية الصحية؛ إذ تُستخدّم تقنية التنقيب في 


yry‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية dalos :)١(‏ وطرق» وخوارزميات التنقيب في البيانات 


البيانات؛ للكشف عن الأنشطة الاحتيالية والحَدّ منهاء لاسيما في مطالبات التأمين واستخدام 
بطاقات الاتثتمان (صةطا0 وآخرون» ٩۱۹۹)؛‏ من أجل تحديد اط شراء Hoffman,) Maal‏ 
9)) واسترداد العملاء ا مربحين (1998 (Hoffman,‏ وأيصًا لتحديد قواعد التداول من البيانات 
التاريخيةء والمساعدة في زيادة الربحية باستخدام تحليل سلة السوق. ويُستخدم التنقيب في 
البيانات بالفعل على نطاق واسع؛ لتحسين التعامل مع العملاءء ومع تطور التجارة الإلكترونية على 
نطاق واسع؛ فإن هذا الأمر لا يمكن أن يصبح أكثر إلحاحًا مع الوقت. انظر الحالة العملية 6-١؛‏ 
للحصول على معلومات حول كيفية استخدام شركة ceilg igul OM Infinity PRC‏ 
في البيانات؛ لتحسين خدمة العملاء ومواجهة الاحتيال وزيادة الرّبح. 


حالة عملية ١-٤‏ 
٠‏ هي تعزيرٌ لتجربة العملاء مع الحَدّ من الاحتيال؛ بالتنقيب في البيانات والتحليلات التنبؤية 

عندما بدأت الشركات المُصدرة للبطاقات لأول مرة باستخدام برامج قواعد العمل 
الآلي؛ لمواجهة الاحتيال في البطاقات المصرفية وبطاقات الائتمان - كانت القيودٌ ا مفروضة 
على هذه التقنية واضحةً تمامًا: اشتكى العملاءٌ من عدم قدرتهم على الدفع لرحلات 
عطلاتهم أو رحلات العمل المهمة. وتعمل Visa‏ على تحسين تجربة عملائها؛ من 
خلال توفير أدوات لتقليل مخاطر الاحتيال؛ إضافةً إلى توفير الخدمات الاستشارية» التي 
جعلت إستراتيجياتها أكثر فعاليةً. وتهدف a Visa‏ خلال buaa dI gll lis‏ تجربة 
العملاءء إضافةً إلى تقليل المعاملات غير الصالحة. 

وجديرٌ بالذكر أنَّ الشبكة العالمية للشركة تربط آلاف المؤسسات امالية بملايين 
التجار وحاملي البطاقات كل يوم. وقد كانت 77114 رائدةً في مجال المدفوعات 
غير النقدية لأكثر من 0١‏ عامًا. كما كانت تدعمٌ المؤسسات اطالية باستخدام تحليلات 
5 وذلك للحَّدّ من الاحتيال دون إزعاج العملاء برفض الدفع دون مبرر. وعندما 
Visa esi‏ بمعالجة إحدى المعاملات؛ فإنها تقوم بتحليل ما dias‏ إلى 0٠١‏ متغير فريد 
بشكل فوري لتقيم مخاطر تلك المعاملة. وتستطيع الشركة باستخدام مجموعات هائلة 
من البيانات» ما ف ذلك النقاط الجديدة الاحتيالية العالمية وأنماط المعاملات - أن 
تُحدّد بدقة ما إذا كنتَ تشتري في باريسء أو أن شخصاً آخر سرق بطاقة الائتمان 
الخاصة بك. وقد ذكر 5211625018 773:3 رئيس حلول الأداء في 17158 بشمال آسيا 
أن: «ما يعنيه ذلك هو أنه إذا كنت ستسافر على الأرجح؛ فنحن نعرف ذلك ونخبر 
مؤسستك امالية حتى لا يتم رفضك في نقطة البيع». وأضاف: «كما أننا سوف نساعدٌ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري v‏ 


الفصل الرابع 


البنك الذي تتعامل معه في تطوير الإستراتيجيات الصحيحة لاستخدام أدوات التأشير 
وأنظمة تسجيل الدرجات». وتستطيع 17154 أن تقوم بعمل تحليلات البيانات الكبيرة؛ 
ومن المحتمل ان تستطيع النماذج الحديثة وأنظمة تسجيل الدرجات gi‏ ماقيمته 
۲ مليار دولار سنوياً من حجم المدفوعات المزوّرة. 

Visa Axis‏ اسمًا معترفًا به عالميًاه وتسهّل 1/158 تحويل الأموال إلكترونيًا من خلال 
المنتجات ذات العلامة التجارية التي يُصدرها الآلاف من شركاء المؤسسات اطالية. وقد 
قامت الشركة معالجة ٤,۹‏ مليار صفقة ف عام ١٠١۲م»‏ وت عمليات شراء بقيمة ۷ر٤‏ 
تريليون دولار مع بطاقة فيزا في نفس العام. 

كما أنَّ 17158 لديها القدرة على معالجة 0٠٠٠‏ رسالة معاملة ف الثانية الواحدة, 
وهذا الرّقم أكبر من أربعة أضعاف معدل الذروة الفعلي للصفقة حتى الآن. ولا تقوم 
8 بالمعالجة والحساب فقط؛ بل هي تستخدم باستمرار التحليلات لتبادل الرؤى 
الإستراتيجية والتشغيلية مع مؤسساتها المالية الشريكة ومساعدتها في تحسين الأداء. 
es‏ دَعُم هدف هذا العمل من خلال نظام إدارة بيانات قوي. وإضافةً إلى ما سبق؛ OB‏ 
فيزا تساعدٌ عملاءها على تحسين الأداء من خلال تطوير وتقديم رؤية تحليلية عميقة. 

:Falkenborg Jsà‏ «إننا نفهم أنماط السلوك من خلال إجراء التجميع والتجزئة 
على مستوى دقيق» ونحن نقدّم هذه الرؤية لشركائنا في ا مؤسسات امماليةء إنها طريقةٌ 
uslub Iks‏ عملائنا على التواصل بشكلٍ أفضل وتعميق فهمهم للعميل». 

وكمثالٍ على الدّعم التسويقي؛ فقد ساعدت 17158 العملاء على الصعيد العالمي في 
تحديد شرائح العملاء التي يجب أن يُقدّمِ لها مُنتَجِ 17159 مختلف. يقول 18هطصه!501: 
ish‏ فهم دورة حياة العملاء أمرًا مهما للغاية» وتوفر فيزا معلومات للعملاء الذين 
يساعدونهم في اتخاذ الإجراءات وتقديم المنتج المناسب للعميل المناسب قبل أن يصبح 
عرض القيمة متقادمًا». 

كيف يمكن لاستخدام التحليلات التي في الذاكرة أن تُحدث فرقًا؟ 

تستخدم 17158 مؤخرًا حلاً عالي الأداء lasso SAS o‏ على الحوسبة في الذاكرة 
لتشغيل الخوارزمية الإحصائية تہ وتلم الآلة. ثم تقديم المعلومات doa JS‏ إذ تقلّل 
التحليلاث ق الذاكرة من الحاجة إلى نقل البيانات وتنفيذ امزيد من عمليات تكرار 
النموذج؛ مما يجعلها أسرع وأكثر 485 


ع ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عملية» وطرقء وخوارزميات التنقيب في البيانات 


ويّصف 58211620018 الحلَّ على أنه مثل حفظ المعلومات. بدلا من الاضطرار 
للذه اب إلى خزانة الملفات لاستردادها. فيقول: «التحليلات في الذاكرة تأخذ فقط 
عقلك وتجعله أكبر. كلّ شيءٍ يمكن الوصول إليه على الفور». 

وف نهاية المطاف؛ فإن التحليلات القوية تساعد الشركة على القيام بأكثر من مجرد 
:Falkenborg Js» .—les344l alae‏ «ممكننا تعميق محادثة العميل وخدمة عملائنا 
بشكلٍ أفضل؛ من خلال مجموعة البيانات الضخمة والخبرات الكبيرة في مجال استخراج 
بيانات المعاملات» نحن تستخدم قدراتنا في الاستشارات والتحليلات لمساعدة عملائنا في 
مواجهة تحَدَّيات الأعمال وحماية نظام الدفع. وهذا ما نفعله بتحليلات عالية الأداء». 

وأضاف 16ه0م1:21/6 موضحًّا: «إِنَّ التحَدَّي الذي نواجهه لا يختلف Gi oe‏ 
55 يواجه أيّ شركة تديرٌ وتستخدم مجموعة البيانات الضخمة؛ فهو يتمثل في كيفية 
استخدامنا لجميع المعلومات اللازمة لوَضْعَ iss‏ للتحَدّيات التي تواجه الأعمال - سواء 
كان ذلك من شأنه تحسين نماذج الاحتيال لديناء أو مساعدة العميل على التواصل بشكلٍ 
أكثر فعاليةٌ مع زبائنه». ثم استطرد قائلًا: «تمكّننا التحليلات في الذاكرة من أن نكون 
أكثر فطنةً؛ مع سرعة معالجة ٠٠١‏ نظام تحليلي؛ حيث يمكن لبياناتنا ولعلماء القرار 
لدينا التكرار بشكلٍ أسرع». 

وتسمخ التحليلات التنبؤية السريعة والدقيقة لشركة 1/154 بتقديم خدمة أفضل 
للعملاء؛ إضافةً إلى خدمات استشارية مُتخصّصة؛ مما يساعدهم على النجاح في صناعة 
المدفوعات المتغيرة سريعًا بشكل يومي. 

أسئلة للمناقشة: 

-١‏ ما هي التحَدّيات التي واجهتها 17158: وباقي صُنَاعَ بطاقات الائتمان؟ 

case CASS -Y‏ 7/158 من تحسين خدمة العملاء مع الاحتفاظ بتحسين الاحتيال؟ 

$45 p» as llo ما هي التحليلات في الذاكرة»‎ - 
Source: "Enhancing the customer experience while reducing fraud (SAS* Analytics) 
- High-performance analytics empowers Visa to enhance customer experience while 


reducing debit and credit card fraud." Copyright 6 2016 SAS Institute Inc., Cary, 
NC, USA. Reprinted with permission. All rights reserved. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vro‏ 


الفصل الرابع 


التعريفات. والخصاتصء والفواتد: 
إِنَّ مصطلح التنقيب في البيانات ببساطة؛ هو مصطلحٌ AS) pis‏ اكتشاف أو «استخراج» 
المعرفة من كميات كبيرة من البيانات. وبالقياس؛ فإنه عند النظرء يستطيع ال مرء أن يدرك بسهولة 
أنَّ مصطلح التنقيب في البيانات ليس صحيحًا؛ إذ إنه يُطلّق على استخراج الذهب من الصخور أو 
التراب» ويُشار إليه باسم استخراج «الذهب» بدلا من الاستخراج «الصخري» أو «الترابي». ولذلك؟ 
فقد كان الأصح أن يُقال: «استخراج المعرفة» أو «اكتشاف المعرفة» بدلا من التنقيب في البيانات. 
وعلى الرغم من عدم التوافق بين المصطلح ومعناه؛ فقد أصبح التنقيبٌ في البيانات هو اختيار 
الأغلبية. فالعديدٌ من الأسماء الأخرى ال مرتبطة بالتنقيب في البيانات تشمل: استخراج المعرفة, 
وتحليل النمطء وعلم الآثار. وحصاد المعلومات» والبحث عن الأماطء وتجريف البيانات. 
ومن الناحية الفنية؛ فإن عملية التنقيب في البيانات هي عمليةٌ تَستَخدِم تقنيات إحصائية 

ورياضية» وأساليب الذكاء الاصطناعي لاستخلاص وتحديد المعلومات المفيدة والمعرفة (أو الأنمماط) 
الفرعية من مجموعات كبيرة من البيانات» ومن الممكن أن تكون هذه الأنماط في شكلٍ قواعد العمل 
أو الانتماءات أو الارتباطات أو الاتجاهات أو نماذج التنبق (انظر: 2001 -(Nemati and Barko,‏ 
ومعظم الأدبيات تُعرّف التنقيبَ في البيانات بأنه: «عمليةٌ غير بديهية لتحديد أنماط صالحة 
وجديدة ومفيدة ومفهومة في نهاية المطاف ف البيانات المخرّنة في قواعد البيانات المنظمة»؛ إذ 
يتم تنظيمٌ البيانات في سجلات منظمة من قبل المتغيرات الفئوية والترتيبية والمستمرة (1:8(:80 
وآخرون» ۱۹۹١‏ ص .)6١-6١‏ وفي هذا التعريف؛ نجد أن معاني المصطلح الأساسي كما يلي: 
- تشيرُ العملية إلى أن التنقيب في البيانات يضم العديد من الخطوات المتكرّرة. 
- غير بديهي؛ بمعنى أن هناك بعض عمليات البحث أو الاستنتاج من نوع التجارب؛ بمعنى أنه 

Foaia l Baa gl 
صالح؛ بمعنى أن الأنماط المكتشفة يجب أن تنطبق على البيانات الجديدة بدرجة كافية من اليقين.‎ - 
غير مألوفة؛ بمعنى أنَّ الانماط لم تكن معروفةً من قبل للمُستخدم في سياق النظام الجاري تحليله.‎ - 
الفائدة المحتمّلة؛ وتعني أنَّ الأنماط المكتشّفة يجب أن تؤدي إلى فائدة بعيدة للمستخدم أو المهمة.‎ - 
وأخيرًا؛ مفهومًا؛ بمعنى أنَّ النمط يجب أن يكون منطقيًا من الناحية التجارية إلى الدرجة التي‎ - 

تجعل المُستخدم يقول: «امممم يبدو الأمر معقولا؛ لماذا لم أفكر في ذلك» وإن لم يكن هذا على 

الفورء فعلى الأقل بعد تحليل بعض نتائج العمل». 


v1‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عملية وطرق» وخوارزميات التنقيب في البيانات 


إنَّ التنقيبَ في البيانات ليس نظامًا جديدًا؛ بل هو تعريفٌ جديدٌ لاستخدام العديد من 
التخصّصات؛ إذ يتم وَضْعِ بيانات الاستخراج بشكل مُحكّم عند تلاقي العديد من التخصصات» 
والتي تشمل الإحصاء والذكاء الاصطناعي وتعلم الآلة وعلوم الإدارة ونظم ا معلومات (18) وقواعد 
البيانات (انظر الشكل ٠١-6‏ ) إذ إِنَّ عملية التنقيب في البيانات تسعى جاهدةً إلى التحسين في 
استخراج المعلومات وا معارف المفيدة من قواعد البيانات الكبيرة. عن طريق استخدام التقدِّم في 
جميع التخصّصات السابقة. وعلى الرغم من أن هذا ا مجال لا يزال ف بداياته؛ فإنه جذب إليه 


الكثيرَ من الاهتمام في Sg‏ قصير للغاية. 


UM 
ونظم المعلومات‎ 











شكل :٠-6‏ التنقيب في البيانات هو مزيجٌ من التخصصات المتعددة 
وفيما يلي الخصائصٌ والأهداف الرئيسية للتنقيب في البيانات: 
ex b Us -‏ دفن البيانات في أعماق قواعد البيانات الكبيرة جدًاء والتي تحتوي أحيانًا على بيانات 
Sie go‏ سنوات. وفي العديد من الحالات؛ فإن تنظيفٌ البيانات وتوحيدها يتم في مستودع 
البيانات؛ إذ مُكن تقديم البيانات بتنسيقات متنوعة (انظر: الفصل ١‏ لتصنيف موجز للبيانات). 
- بيئة التنقيب في البيانات؛ هي عادةً بنية العميل/ الخادم أو بنية IS‏ على الويب. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري rv‏ 








الفصل الرابع 


- تساعد الأدوات الجديدة المتطوّرة» والتى تشمل أدوات التصوير المتقدّمة: على إزالة مصادر 
اللعلومات المدفونة في ملفات الشركة أو الشّجلات العامة الأرشيفية. والبحث عن ذلك يشمل 
تدفق ومزامنة البيانات؛ للحصول على النتائج الصحيحة. كما يستكشف العمالٌ المتقنون 
للتنقيب في البيانات أيضًا جدوى البيانات الضعيفة (أيْ: النص غير المُنظّم المُخرَّن في أماكن 
si Lotus Notes clo asl Jis‏ الملفات النصية على الإنترنت أو الشبكات الداخلية على 
مستوى اللؤسسة). 
- غالبًا ما يكون عاملٌ التنقيب في البيانات مُسِتَحْدَمًا نهائيّه ويتمُ تمكينه بواسطة مثاقيب البيانات 
وأدوات الاستعلام القوية الأخرى لطرح أسثلة مُخصمّصة والحصول على إجابات بسرعة؛ وذلك 
من خلال استخدام مهارة برمجة محدودة أو منعدمة. 
- وكثيرًا ما ينطوي التنقيبٌ الموسّع في البيانات على إيجاد نتيجة غير متوقعة» ويتطلب من 
المستخدمين النهائيين التفكيرَ بصورة إبداعية خلال العملية: بما في ذلك تفسير النتائج. 
- يتم الجَمْع بين أدوات التنقيب في البيانات بسهولة مع جداول البيانات وأدوات تطوير البرمجيات 
الأخرى. وبالتالي؛ يكن تحليلٌ البيانات المتحضّل عليهاء ونَشْرها بسرعة وسهولة. 
- نظرًا للكميات الكبيرة من البيانات وجهود البحث المكثفة؛ فإنه من الضروري في بعض الأحيان 
استخدام المعالجة المتوازية للتنقيب في البيانات. 
ومكن للشركة التي تستفيدٌ بشكلٍ فعّال من أدوات وتقنيات التنقيب في البيانات؛ الحصولٌ 
على مَيْزَة تنافسية إستراتيجية والحفاظ عليه! إذ يُوفْر التنقيبٌ في البيانات للمنظمات بيئة 
مُعزّزة لاتخاذ القرارات لاستغلال الفرص الجديدة عن طريق تحويل البيانات إلى سلاح إستراتيجي. 
ولتفاصیل Nemati and Barko (2001) : il cobLJI i cai aslgà Jge- jS]‏ 
كيف يعمل التنقيب في البيانات؟ 
من خلال استخدام البيانات الحالية ذات الصّلة والتي تمّ الحصولٌ عليها من داخل وخارج 
المنظمة؛ يستطيع التنقيبٌ في البيانات أن يبني نماذج لاكتشاف الأنماط بين السّمات المعروضة 
في مجموعة البيانات. وهذه النماذجٌ هي التمثيلات الرياضية (العلاقات/ الارتباطات الخطية 
البسيطة أو العلاقات المعقّدة وغير الخطية) التي تحَدّد الأماط بين سمات الأشياء (كالعملاء أو 
الأحداث) الموضّحة في مجموعة البيانات. وبعض هذه الأنماط تفسيرية (تشرح العلاقات المتبادلة 
والصّلات بين السّمات)» في حين أن البعض الآخر تنبوئية (تُنَبَّ بالقيّم المستقبلية لبعض السّمات). 


YYA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية dalos :)١(‏ وطرق» وخوارزميات التنقيب في البيانات 


وبشكلٍ عام؛ فإن التنقيبٍ في البيانات يسعى إلى تحديد أربعة أنواع رئيسية فقط من الأنماط: 
-١‏ تحديد الترابط في مجموعات مشتركة من الأشياءء مثل: البيرة والحفاضات تسير معًا في تحليل 

سلة السوق. 
eub gés Olza -Y‏ الأحداث المستقبلية لأحداث معينة بناءَ على ما حدث في الماضيء مثل: 

التنبق بالفائز Super Bowl (à‏ أو التنبؤ بالحرارة المطلقة في يوم معين. 
-٣‏ التجميع ويعملٌ على تحديد المجموعات الطبيعية للأشياء استنادًا إلى خصائصها المعروفة, 

مثل: تعيين العملاء في شراتح مختلفة بناءً على التركيبة السكانية وسلوكيات الشراء السابقة. 
-٤‏ العلاقات التسلسلية» وتعمل على گشف علاقات الأحداث الزمنيةء Las ob gul Jio‏ 

مصرفيًا موجودًا لديه بالفعل حساب فحص سيفتح حساب توفير متبوعًا بحساب استثمار في 

غضون عام. 

وقد تمّ استخراجٌ هذه الأنواع من الأنماط يدويًا من البيانات من قبل البشر على مدى قرون» 
غير أن تزايد حجم البيانات في العصر الحديث جعل هناك حاجة إلى طرق أكثر تلقائية. ومع ازدياد 
حجم مجموعات البيانات وتعقيدها؛ ازداد التحليل المباشر للبيانات اليدوية بشكلٍ كبير باستخدام 
أدوات معالجة البيانات الآلية وغير المباشرة التي تستخدم منهجيات وأساليب وخوارزميات 
مُعقدة. ويُشَّار لمظاهر مثل هذا التطور من الوسائل الأوتوماتيكية وشبه الأوتوماتيكية ملعالجة 
البيانات الكبيرة باسم التنقيب في البيانات. 

وبشكل عام؛ فإنه يمكن تصنيف مهامً التنقيب في البيانات إلى ثلاث فئاتٍ رئيسيةء هي: التنبؤ 
والارتباط والتجميع. واستنادًا إلى الطريقة التي يتم بها استخراج الأماط من البيانات التاريخية؛ 
كن تصنيف أنظمة تعلُم خوارزميات التنقيب ف البيانات إلى التنقيب في البيانات في وجود 
إشراف أو بدون إشراف» وتشتمل بيانات التدريب على كل من الصفات الوصفية (أيْ: المتغيرات 
المستقلة, أو متغيرات القرار) إضافةً إلى خاصية الفئة (أَيْ: متغير المُخْرَّجٍ أو متغير النتيجة). 
وفي المقابل؛ فمع التعلّم بدون إشرافء فإن بيانات التدريب تشمل فقط الصفات الوصفية. 
ويوضح الشكل 6-! تصنيقًا بسيطً مهام التنقيب في البيانات» جنبًا إلى جنب مع أساليب التعلّم 
والخوازميات الشائعة لكلّ مهمة من مهام التنقيب في البيانات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yya‏ 


لوازي اليج ين ارات 







EXTYECUITEYPYMUE 1] 
KNN Bayes Naive GA nz ا‎ 

| ۸× juil الإنحدار الخطى وغير‎ | ١ RR ا‎ 
GA kNNGSVM  رادحنإلا وأشجار‎ e TM 

حر ارق وتار تی طرق ب > 
خاضعة للإشراف ١‏ المعنل والتبسيط ARIMAS gl‏ 





Apriori تعظيم التوقعات وخرارزمية‎ xu 
وش لس ل قرس ل‎ zx 


١‏ والتطابق المبنى على الرسم البياتي 


غير خاضعة للإشراف | 16:ه12-0 وتعظيم التوقمات (EM).‏ 

1 
اسا ا سم م لس ہے 
غير خاضعة للإشراف | (EM) iai gd uiii K-means‏ 

1 














شكل 6-!: تصنيف مُبسّط لهام وطرق وخوارزميات التنقيب في البيانات 

- التنبؤ: يُشار إلى التوقع عادةً على أنه إخبارٌ عن المستقبل. وهو يختلف عن التخمين 
البسيط بعدَّة cela‏ مثل: مراعاة الخبرات والآراء وا معلومات الأخرى التي لها صله بالتنبؤ. وهناك 
مصطلحٌ آخر يرتبط عادةً مصطلح التنبؤ هو التوفّع» وعلى الرغم من اعتقاد الكثيرين أن هذين 
المصطلحين مترادفان؛ فإِنَّ هناك اختلاقًا دقيقًا بل حاسماً بين المصطلحين. فالتنبؤ يُستخدّم إلى حَذٌ 
كبيرٍ في الإشارة إلى الخبرة والرأي» في حين أن التوقع هو البيانات والنموذج القائم. ومن أجل زيادة 
الثقة يمكن للمرء أن يدرج المصطلحات التي لها صِلةٌ ببعضهاء مثل: التخمينء والتنبؤء والتوقع 
على التوالي. وفي مصطلحات التنقيب في البيانات؛ يتم استخدامٌ التنبؤ والتوقع بشكلٍ مترادف» 
ويُستخدّم مصطلح التنبؤ باعتباره التمثيل المشترك للفعل. وتبعًا لطبيعة ما يتم التنبؤ به؛ فإنه 


Ye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 

















التحليلات التنبؤية :)١(‏ عمليةء وطرق» وخوارزميات التنقيب في البيانات 
يمكن تسمية التنبؤ بشكلٍ أكثر تحديدًا على أنه تصنيفٌ (حيث يكون الشيء الذي يتم التنبؤ به 
مثل: تنبؤات الغد والتي تُصنّف حالة الجو إلى «ممطر» أو «مشمس») أو انحدارٌ (حيث يتم التنبق 
بشيء» مثل: درجة حرارة الغدء والتي تكون عبارة عن رقم حقيقيء مثل «10 درجة فهرنهايت»). 
- التصنيف: ويُقصّد به التصنيف أو الإشراف التعريفي» وهو الأكثر شيوعًا في جميع مهام 
التنقيب في البيانات. والهدف من التصنيف؛ هو تحليلٌ البيانات التاريخية المخرَّة في قاعدة 
البيانات وإنشاء نموذج تمكنه التنبؤ بالسلوك المستقبلي تلقائيًا. ويتكوّن هذا النموذج المستحدّث 
من تعميمات لسجلات مجموعة بيانات التدريبء والتي تساعد على تمييز الفئات المحدّدة مسبقًا. 
ونأمل أن يُستخدّم هذا النموذج بعد ذلك للتنبؤق بفئات السجلات الأخرى غير المصنّفة, والأهم 
من ذلك» للتنبؤ بدقة بالأحداث المستقبلية الفعلية. وتشمل أدوات التصنيف الشائعة: الشبكات 
العصبية وأشجار القرارء والتحليل اللوجستي وتحليل التمييز (من الإحصاءات التقليدية)» 
والأدوات الناشئة» مثل: المجموعات الخامء وآلات متجه الدعم (577815).: والخوارزميات الجينية. 
وقد تلقث تقنيات التصنيف القائمة على الإحصاء (على سبيل المثال: الانحدار اللوجستي وتحليل 
التمييز) نصيبها من الانتقادات - وهي أنها تضع افتراضات غير واقعية حول البيانات» مثل: 
الاستقلالية والوضْع الطبيعي - مما يَحِدُ من استخدامها في مشاريع التنقيب في البيانات من النوع 
التصنيفي. وتنطوي الشبكات العصبية على تطوير هياكل رياضية (تشبه إلى حَدَّ ما الشبكات 
العصبية البيولوجية في الدماغ البشري) والتي لديها القدرة على التعلّم من التجارب السابقة 
المقدمة في شكل مجموعات بيانات جيدة التنظيم. فهي تميلٌ إلى أن تكون أكثر فعاليةَ عندما 
يكون عدةٌُ المتغيرات المعنيّة كبيرا إلى حَدَّ ما والعلاقات فيما بينها معقدة وغير دقيقة. وجديرٌ 
بالذّكر أن الشبكات العصبية لها عيوبٌ كما أن لها مزايا. فعلى سبيل المثال: عادةً ما يكون من 
الصعب للغاية توفير مُبرّرات جيدة للتنبؤات التي تقوم بها الشبكة العصبية. إضافة إلى أن 
الشبكات العصبية تحتاج إلى تدريب كبير. ولسوء الحظ؛ فإن الوقت اللازم للتدريب يزداد 
بشكل كبير مع زيادة حجم 'البيانات» وبشكل غاه؛ فإنه لمكن قدريب الشبكات العصبية غلى 
قؤاعن بيانات كر جد ؛"وهذه العواهل وغيرها ساعدت غان'تحديث إمكانية مطبيق الشبعات 
العصبية في المجالات الغنية بالبيانات. 
وتقوم أشجارٌ القرار بتصنيف البيانات إلى عدد مُحدَّد من الفئات بناءً على قيّم متغيرات الإدخال. 
وأشجار القرار؛ هي في الأماس تسلسلٌّ هرمي للبيانات ثم تكون أسرع بشكلٍ ملحوظ من الشبكات 
العصبية. فهي أكثر ملاءمةً للبيانات الفئوية والفترة الزمنية. ولذلك؛ فإن دَمْج المتغيرات المستمرة في 
إطار شجرة القرارات يتطلب تفكيرا؛ أيّْ: تحويل المتغيرات الرقمية القيّمة المستمرة إلى النطاقات والفئات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري e!‏ 


الفصل الرابع 


cols ài Ui‏ الصّلة من أدوات التصنيف؛ فهي استقراءٌ القاعدة. وهي على عكس شجرة 
القرارء ومع استقراء القاعدة؛ فإن العبارات حينئذ تنتج عن ias Olly‏ مباشرةً ولا يجب 
أن تكون ذات طبيعة هرمية. وهناك تقنياتٌ أخرى حديثة مثل S۷٥۷‏ ومجموعات صعبةء 
وخوارزميات جينية» تجد طريقها تدريجِيًا إلى ترسانة من خوارزميات التصنيف. 

- التجميع: هو عبارة عن تجميع أقسام مجموعة من الأشياء (على سبيل المثال: كائنات» 
أحداث» معروضة في مجموعة بيانات منظمة) إلى شرائح (أو مجموعات طبيعية) يتشارك أعضاؤها 
في خصائص متشابهة. فهو على عكس التصنيف؛ إذ إِنَّ تجميع تصنيفات الفئات غير معروف. 
وإذ إِنَّ الخوارزميات $2 عبر مجموعة البيانات؛ فإن تحديد القواسم المشتركة للأشياء يتم £a‏ 
على خصائصهاء ومن ثمٌ يتم إنشاءٌ المجموعات. ونظرًا لأن المجموعات يتم تحديدها باستخدام 
خوارزمية من النوع التجريبي؛ ولأن الخوارزميات المختلفة قد تنتهي بمجموعات مختلفة من 
ا مجموعات لمجموعة البيانات نفسهاء قبل أن يتم وَضْع نتائج تقنيات التجميع للاستخدام الفعلي؛ 
فقد يكون من الضروري وجود خبير لتفسيرء وربما تعديلء المجموعات المقترحة. وبعد تحديد 
المجموعات المعقولة: يمكن استخدامها لتصنيف وتفسير البيانات الجديدة. 

وليس من المُستَغْرَب أن تشتمل تقنيات التجميع على تحقيق الدرجة المثلى. والهدف من 
التجميع هو إنشاء مجموعات؛ بحيث يكون للأعضاء داخل كلّ مجموعة أقصى درجة من التشابه 
والأعضاء عبر المجموعات لديهم الحَدٌ الأدنى من التشابه. وتتضمّن تقنيات التجميع الأكثر 
استخدامًا وسائل >! (من الإحصائيات) وخرائط التنظيم الذاتي (من تعلّم الآلة). وهي بنيةٌ فريدة 
للشبكة العصبية طوّرها )1982( .Kohonen‏ 

وغالبًا ما تستخدم الشركاتٌ بفاعلية نُظُّم التنقيب في البيانات لديها؛ لإجراء التجزئة في السوق 
مع التحليل التجميعي. وتحليل المجموعة؛ يُعَنُ وسيلةٌ لتحديد فئات العناصر؛ بحيث تكون 
العناصرٌ الموجودة في مجموعة مشتركة بعضها مع بعض بشكل أكبر من العناصر الموجودة في 
مجموعات أخرى. وتمكن استخدامه في تقسيم العملاء وتوجيه المنتجات التسويقية المناسبة 
إلى الشرائح في الوقت المناسب وبالشكل المناسب وبالسعر المناسب. يُستَخدّم تحليل المجموعة 
yai Lái‏ التجمّعات الطبيعية للأحداث أو الكائنات؛ بحيث تمكن تحديدٌ مجموعة مشتركة 
i kietai Sen‏ 

- الاقتران: إنَّ الجمعيات. sela els g‏ الترابط في التنقيب في البيانات؛ تقنيةٌ شائعةٌ ومدروسةٌ 
جيدًا لاكتشاف العلاقات المثيرة بين المتغيّرات في قواعد البيانات الكبيرة. وبفضل تقنيات جَمْع 


rer‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): عملية» وطرقء وخوارزميات التنقيب في البيانات 


البيانات الآليةء مثل: ماسحات الباركود؛ فإن استخدام قواعد الرَّبط لاكتشاف الإجراءات المنتظمة 
بين المنتجات في المعاملات الكبيرة التي سجَّلتها أنظمة نقاط البيع في محلات السوبر ماركت أصبحت 
مهمةً في اكتشاف معرفة مشتركة في صناعة البيع بالتجزئة. وفي سياق صناعة البيع بالتجزئة: غالبًا 
ما يُطلّق على الاستخراج الخاص بقواعد الارتباطات: تحليل السوق. وهناك اثنان من المشتقات 
الشائعة الاستخدام؛ وهما: رابطة الاستخراج من القاعدة وتحليل الارتباط وتسلسل الاستخراج. 
وباستخدام تحليل الارتباطات» يتم اكتشاف الارتباط بين العديد من الأشياء ذات الأهمية تلقائيًّه 
مثل الارتباط بين صفحات الويب والعلاقات المرجعية بين مجموعات مؤلفي النشرات الأكادهية. 
ومع الاستخراج التسلساي؛ يتم فَخْص العلاقات؛ من حيث ترتيب حدوثها لتحديد الجمعيات مع 
مرور الوقت. وتتضمّن الخوارزميات المُستخدّمة في استخراج القاعدة المشتركة 1011:م4 الشهير 
(حيث يتم التعرّف على العناصر .Eclatg ZeroRg OneRg .FP-Growths (85$zll‏ 

التصويرٌ والتنبُو بالسلسلة الزمنية؛ هناك تقنيتان ترتبطان في الغالب بالتنقيب في البيانات؛ 
وهما التصويرٌ والتنبؤ بالسّلسلة الزّمنية. ويمكن استخدامٌ التمثيل المرئي بالاقتران مع تقنيات 
التنقيب ف البيانات الأخرى؛ للحصول عاى فَهْم أكثر وضوحًا للعلاقات الأساسية. ومع ازدياد 
أهمية التصوير في السنوات الأخيرة؛ ظهر مصطلحٌ oue‏ وهو التحليلات المرئية. وتكمُنُ الفكرة 
في الجَمْع بين التحليلات والتصوير في بيئة واحدة لتسهيل إنشاء المعرفة بشكلٍ أسهل وأسرع. وقد 
تمّ تغطية التحليلات المرئية بالتفصيل في الفصل . وفي توقع السلسلة الزمنية؛ تتكوّن البيانات 
من قِيّم المتغيّر نفسه الذي يتم التقاطه وتخزينه مع مرور الوقت في فواصل زمنية منتظمة. ثم 
يتم استخدام هذه البيانات لتطوير نماذج التوقع لاستقراء القيم المستقبلية للمتغير نفسه. 


التنقيب في البيانات مقابل الإحصاءات: 

هناك الكثيرٌ من القواسم المشتركة بين التنقيب في البيانات والإحصاءات. فكلاهما يبحث عن 
العلاقات داخل البيانات. ومعظم الناس يتصلون بالإحصائيات «أساس التنقيب في البيانات». 
والفرق الرئيس بين الاثنين؛ هو أن الإحصائيات تبدأ بفرضية مُحدّدة بدقة؛ في حين تبدأ عملية 
التنقيب في البيانات ببيان اكتشاف غير مُحدَّد المعالم. وتجمع الإحصائيات بيانات عينة (أَيْ: 
بيانات أولية) لاختبار الفرضية: في حين أنَّ التنقيب في البيانات والتحليلات تستخدم جميع البيانات 
الموجودة (أيْ: البيانات الثانوية الملاحظة في الغالب) لاكتشاف أنماط وعلاقات جديدة. وهناك 
فرق آخر يأتي من حجم البيانات التي يستخدمونها؛ إذ يبحث التنقيب في البيانات عن مجموعات 
البيانات «الكبيرة» قدر الإمكان؛ في حين تبحث الإحصائيات عن الحجم الصحيح للبيانات (إذا 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري rer‏ 


الفصل الرابع 

كانت البيانات أكبر من المطلوب/ المطلوب للتحليل الإحصاقيء يتم استخدام عينة من البيانات). 
ِنَّ معنى «البيانات الضخمة» يختلف إلى حَدَّ ما بين الإحصاءات والتنقيب في البيانات. وهناك 
القليلٌ من المئات إلى الآلاف من نقاط البيانات الكبيرة بما يكفي للتحليل الإحصاي, bie Í yè‏ 
ملايين إلى بضع مليارات من نقاط البيانات تُعَدّ كبيرةً بالنسبة لدراسات التنقيب في البيانات. 


حالة عملية ۲-٤‏ 
احتفاظ شركة 17611 بذكاء وفعالية تحليلاتها في القرن الحادي والعشرين 
لقد غيّرت الثورة الرقمية كيفية تسوق الناس؛ إذ تشير الدراسات إلى أنه حتى 
العملاء التجاريين ييستخدمون المزيدَ من حلولٍ البحث عن رحلة الشراء الخاصة بهم 
عبر الإنترنت قبل ارتباطهم ببائع. ومن أجل التنافس؛ فإن بعض الشركات. مثل: شركة 
161 تقوم بتحويل نماذج المبيعات والتسويق لدعم هذه المتطلبات الجديدة. ومع 
ذلك؛ فإن القيام بهذا الأمر على نحو dha Jé‏ حلّ «البيانات الكبيرة» والذي d‏ :4 
تحليل قواعد بيانات الشركات جنبًا إلى جنب مع معلومات غير منظمة من مصادر مثل 
5 والشبكات الاجتماعية. 
لقد تطوّرت 2611 لتصبح رائدةً في مجال التقنية من خلال استخدام العمليات 
الفعّالة القائمة على البيانات؛ إذ تكن للموظفين الحصولٌ على نتائج قابلة للقياس 
لعقود قادمة من الزمان؛ وذلك من خلال استخدام تطبيقات المؤسسات لدعم الرؤية 
وتسهيل العمليات» مثل: إدارة علاقات العملاء (/0181) والمبيعات والمحاسبة. وعندما 
أدركت 1611 أن العملاء يقضون وقنًا أطول في البحث عن المنتجات عبر الإنترنت قبل 
الاتصال بمندوب مبيعات؛ أرادت تحديث النماذج التسويقية وفقًا لذلك؛ بحيث هكنها 
تقديم الأنواع الجديدة من الخدمات المخصّصة والدعم الذي يتوقعه العملاء. لإجراء 
هذه التغييرات» ويحتاج موظفو التسويق إلى المزيد من البيانات حول سلوك العملاء 
عبر الإنترنت. كما يحتاج الموظفون إلى طريقة أسهل لتضييق الرؤية من خلال العديد 
من أدوات ذكاء الأعمال ومصادر البيانات. وقد ذكر 2111166 17:6 المدير التنفيذي 
لتحليلات السوق والأفكار في 1611 أن: «هناك العديدَ من المعلومات المتاحة عن 
عادات التسوق عبر الإنترنت وخارج الإنترنت للعملاء. نحن بحاجة فقط إلى إعطاء 
موظفي التسويق حلا سهل الاستخدام يمْكنه استيعاب كل ذلكء وتحديد الأنماط وتقديم 
توصيات حول الإنفاق على التسويق والأنشطة». 


vee‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عمليةء وطرقء وخوارزميات التنقيب في البيانات 


إنشاء فريق ذكي لتعزيز عائد الاستثمار (۸01) باستخدام ذكاء الأعمال والتحليلات: 
ومن أجل تحسين إستراتيجية ذكاء الأعمال والتحليلات والاتصالات العاممية؛ فقد 
أنشأت 1611 فريقًا مهما لتقنية المعلومات. كما أنشأً المديرون التنفيذيون نموذجًا ذكيًا 
للحوكمة في الفريق؛ حتى يتمكّن من الاستجابة بسرعة لمتطلبات ذكاء الأعمال المتطوّرة 
للموظفين ومتطلبات التحليلات وتقديم عائد استثمار سريع. فعلى سبيل المثال: نجد أنه 
إضافة إلى امتلاك حرية التعاون مع مجموعات الأعمال الداخلية؛ فإنه يتم تمكين فريق 
العمل من تعديلٍ الأعمال وعمليات تقنية المعلومات باستخدام الإستراتيجيات الذكية 
والمبتكرة. كما يجبٌ أن يكرّس الفريق أكثر من 60٠‏ من جهوده لتحديد وتنفيذ المكاسب 
السريعة لذكاء الأعمال ومشاريع التحليلات التي عادةً ما تكون صغيرة جدًا بالنسبة لقائمة 
أولويات «4» بقسم تقنية المعلومات في 2611. كما يجب على الفريق أيضًا أن ينفق ما 
لايقل عن ١‏ من وقته في التبشير داخل مجموعات الأعمال الداخلية لرفع مستوى 
الوعي حول التحويلات التي تتمتع بها ذكاء الأعمال - فضلًا عن الفرص المتاحة للتعاون. 
وقد كان أحدٌ المشروعات الأولى لفريق العمل؛ هو was d> olu]‏ لبراءات الاختراع 
والتحلیل 3,55( 48s Workbench Analytics ab‏ ركّز تطبيقه المبدي على مجموعة 
مختارة من حالات الاستخدام حول ارتباطات العملاء التجاريين عبر الإنترنت وخارجها. 
وقد تم دَعْم هذا المجهود من قبل مؤسسات تقنية المعلومات والتسويق في 2611 
.Fadi Taffal Js à)‏ مدير شركة تقنية المعلومات في شركة 1611: «كانت هناك رغبةٌ في 
توسيع نطاق استخدام هذا الحل لدعم العديد من أنشطة المبيعات والتسويق في أقرب 
وقتِ ممكن. ومع ذلك؛ كنا نعلم أننا نستطيع بناء حل أكثر فعالية إذا قمنا بتطويره 
من خلال الجهود السريعة المتسارعة». 
سوق معلومات واحد ضخم (11311 10212 Massive‏ 011) لتسهيل مصدر واحد للحقيقة: 
ومن خلال العمل بجدية مع التسويق؛ فإن مهندس و فريق العمل يستخدمون 
إستراتيجيات تطوير البرمجيات الضعيفةء والعديد من التقنيات لإنشاء سوق بيانات قابلٍ 
للتوسع بشكل كبير؛ إذ adl edad‏ الشامل العديد من التقنيات والأدوات لتمكين 
أنواع مختلفة من مستودعات البيانات» واممعالجة البارعةء وأنشطة التشغيل الآلي. فعلى 
سبيل المثال: يقوم المهندسون بمستودعات البيانات غير الُنظمة من مصادر الوثائق 
الرقمية/ الاجتماعية على الخوادم التي تقوم بتشغيل 112000 21:6م4؛ إذ يستخدمون 
صيغة ۲ئ4 4ةلهإ1؛ لدَمج واستكشاف كميات كبيرة من بيانات العملاء من مصادر 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yeo‏ 


الفصل الرابع 


أخرى بشكلٍ فوري. وبالنسبة للعديدٍ من متطلبات تحويل البيانات والتشغيل الآلي؛ 
Ji ó‏ يتضمّن استخدام برمجيات 1044 من Dell‏ وتحديدًا «Toad Data Point‏ 
Žala «Toad Intelligence Central g‏ إلى ‘Dell Statistica‏ إذ توفر برمجية 1020" 
ÅA gzl Data Point‏ للأعمال لمعالجة البيانات والتشغيل الآليء وهي فجوةٌ Aer‏ 
في النظام البيئي. وبالنسبة للنماذج التحليلية المتقدّمة؛ فإن النظام يستخدم 120611 
151 والذي يوفر إعداد البيانات والتحليلات التنبؤية واستخلاص البيانات والتعرّف 
Olearys JYI‏ وتحليلات النصوص. والتوقيع والإبلاغء ونشر النموذج ومراقبته. 
ويستفيد المهندسون أيضًا من هذا الحل لتطوير نماذج تحليلية يمكن من خلالها فحص 
جميع البيانات المتباينة وتقديم صورة دقيقة لسلوك التسوق لدى العملاء. وتوفر 
الأدوات اقتراحات لتحسين الخدمة؛ إضافةً إلى مقاييس غائد الاستثمار لإستراتيجيات 
od‏ المنتجات التي تشمل التسويق عبر الويب والمكالمات الهاتفية وزيارات المواقع. 





وفي غضون عِدَّة أشهر كان المهندسون يستخدمون منضدة التحليلات التسويقية 
الأولية. كما قامت فرقة العمل بالتخطيط لتوسيع إمكانات الحلّ حتى تتمكّن من 
تحليل البيانات من مصادر أكثر. وتقديم تصورات إضافية. وقياس عوائد أنشطة 
القنوات الأخرىء مثل: التغريدات: والنصوصء ورسائل البريد الإلكترونيء ومشاركات 
وسائل الإعلام الاجتماعية. 
توفير أكثر من 7,0 مليار دولار في التكاليف التشغيلية: 

ومن خلال الحلول الجديدة؛ فقد قامت شركة 1611 بالفعل بإزالة العديد من تطبيقات 
ذكاء الأعمال الخاصة بطرف ثالث. وقد ذكر «Chaitanya Laxminarayana‏ مدير برنامج 
التسويق في شركة 0611 أنه: «على الرغم من أننا ف ا مراحل الأولى من طرح منبر التسويق 
التحليلي؛ فإننا وفنا حوالي 1,0 مليون دولار في تكاليف الاستعانة بمصادر خارجية للمورّدين». 
«وإضافةً إلى ذلك؛ يحصل الموظفون على إحصاءات أسرع وأكثر تفصيلًا». ونظرًا لأن 72611 
تقوم بتحجيم نطاق تحليل التسويق؛ فإنها ستعمل على التخلّص التدريجي من تطبيقات 
ذكاء الأعمال الأخرى التابعة لجهات خارجية؛ مما يقلل من التكاليف ويُعرّز الكفاءة. 

تسهیل ٥,۳‏ مليون دولار في الإيرادات: 


giai‏ موظفو التسويق الآن بالرؤية التي يحتاجون إليها لتحديد الاتجاهات الناشئة 
في ارتباطات العملاء وتحديث النماذج وفقًا لذلك. وقد ذكر Laxman Srigiri‏ مدير 


e1‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عمليةء وطرقء وخوارزميات التنقيب في البيانات 


قسم التحليلات التسويقية في شركة 1611: «لقد حققنا بالفعل ",0 مليون دولار 
كإيرادات متزايدة من خلال إطلاق برامج تسويقية أكثر تخصيصًا وكشف فرص جديدة 
من خلال قاعدة البيانات الكبيرة لتحليلات التسويق». «إضافةً إلى ذلك؛ لدينا برامج في 
مسارها لتوسيع نطاق هذا التأثير عِدَّةَ مرات في السنوات الثلاث المقبلة». 

وعلى سبيل اممثال: يكن للموظفين الآن مشاهدة جدول زمني لتفاعلات العميل عبر 
الإنترنت وبدون اتصال مع 011 ها في ذلك عمليات الشراء»ء وصفحات !1ه الخاصة هموقع 
الويب التي زارها العميل, والملفات التي قاموا بتنزيلها. وإضافةً إلى ذلك؛ يتلقى الموظفون 
اقتراحات لقواعد البيانات؛ لمعرفة وقت وكيفية الاتصال بأحد العملاء؛ إضافة إلى عناوين 
:1 لصفحات محدّدة ينبغي عليهم قراءتها لمعرفة المزيد عن التقنيات التي يبحث عنها 
العميل. يقول 111ع51: «كان من الضروري أن نفهم المتطلبات المتغيّرة؛ حتى نتمكن من 
الحفاظ على ذكائنا. والآن بعد أن أصبح لدينا هذه الرؤية؛ يمكننا بسرعة تطوير نماذج 
تسويقية أكثر فاعلية توفر ا معلومات امخصّصة والدعم الذي يتوقعه العملاء». 

أسئلة للمناقشة: 

-١‏ ما هو التحَدّي الذي واجهته 0611 والذي أذَّى إلى رحلة تحليلاتها؟ 

کا الذي قامت شركة 0611 بتطويره وتنفيذه؟ وماذا كانت النتائج؟ 

-٠‏ كشركة التحليلات نفسهاء استخدمت 2611 عروض خدماتها لأعمالها الخاصة 
هل تعتقد أنه من الأسهل أو الأصعب على الشركة تذوق الدواء الخاص بها؟ وضَّح ذلك. 
Source: Dell: Staying agile and effective in the 21st century. Dell Case Study, software.‏ 


dell.com/casestudy/dell-staying -agile-and- —effective-in-the-21st-century881389. 


Used by permission from Dell. 


أسئلة للمراجعة على قسم 6-؟: 

-١‏ عرف التنقيب في البيانات. واذكر لماذا يُوجَد العديدٌ من الأسماء والتعريفات المختلفة للتنقيب في البيانات؟ 
۲- ما هي العواملٌ الأخيرةٌ التي زادت من شعبية التنقيب في البيانات؟ 

-Y‏ هل يُكَنَّ التنقيبٌ في البيانات تخصصاً جديداً؟ وضح ذلك. 

ع- اذكر بعض الطرق الرئيسة وخوارزميات التنقيب في البيانات؟ 

-٥‏ ما هي الاختلافات الأساسية بين المهامٌ الرئيسة للتنقيب في البيانات؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري اعم 


الفصل الرابع 


٠-٤‏ تطبيقات التنقيب في البيانات: 
لقد أصبح التنقيبٌُ في البيانات ailà Šlo‏ في معالجة العديد من المشكلات والفرص التجارية 
المعقدة. وقد ثبت أنه ناجحٌ للغاية ومفيدٌ في العديد من المجالات» وبعضها مُبِيّن في الأمثلة 
التمثيلية التالية. والهدف من العديدٍ من تطبيقات التنقيب في البيانات التجارية؛ هو حل مشكلة 
aola‏ أو استكشاف فرصة عمل ناشئة لخلق مَيْزة تنافسية سحتام 
- إدارة علاقات العملاء: إدارة علاقات العملاء (08134) هى امتدادُ التسويق التقليدي. ويتمثل 
الهدف من إدارة علاقات العملاء 0834 في إنشاء علاقات فردية مع العملاء من خلال تطوير 
الفهم الدقيق لاحتياجاتهم ورغباتهم. ومع قيام الشركات ببناء علاقات مع عملائها مرور 
الوقت من خلال مجموعة متنوعة من التفاعلات (مثل: استفسارات المنتج والمبيعات» وطلبات 
الخدمة: ومكالمات الضمان: ومراجعات المنتجاتء واتصالات وسائل التواصل الاجتماعي)؛ 
فإنها تجمع كمياتٍ هائلةٌ من البيانات. وعند الجمع بين السّمات الدهوغرافية والاجتماعية 
والاقتصاديةء هكن استخدام هذه البيانات الزاخرة با معلومات من أجل: 
-١‏ تحديد المستجيبين/ ا مستفيدين ا محتملين للمنتجات/ الخدمات الجديدة (كتصنيف العملاء). 
۲- فهم الأسباب الجذرية لاستنزاف العملاء؛ لتحسين استبقاء العملاء (أيْ: تحليل التغيير). 
“- اكتشاف ارتباطات متغيّر الوقت بين المنتجات والخدمات؛ لتحقيق أقصى قدر من المبيعات 
والقيمة للعفلاه. : 
ع- تحديد العملاء الأكثر ربحيةً واحتياجاتهم التفضيلية؛ لتعزيز العلاقات وزيادة المبيعات. 
- الخدمات المصرفية: يستطيع التنقيبٌ في البيانات أن يساعدّ البنوك على القيام بما يلي: 
-١‏ أتمتة عملية طلب القرض من خلال التنبؤ الدقيق للمستفيدين الأكثر احتمالاً للتعثر. 
؟- كشف بطاقات الائتمان المزوّرة والمعاملات المصرفية عبر الإنترنت. 
۴- تحديد سبل تعظيم قيمة العميل عن طريق بَيّع المنتجات والخدمات التي من المرجّح أن 
يقوموا بشرائها. 
ع- تحسين العائد النقدي؛ من خلال التنبؤ بدقة بالتدفق النقدي على الكيانات المصرفية (مثل: 
أجهزة الصراف الآليء الفروع المصرفية). 
- البَيْع بالتجزئة والنقل والإمداد: في صناعة البيع بالتجزئة؛ يمكن استخدام التنقيب في البيانات في: 
-١‏ التنبؤ بحجم مبيعات دقيقة في مواقع البيع بالتجزثة المحَدَّدة لتحديد مستويات المخزون الصحيح. 


YEA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية dalos :)١(‏ وطرق» وخوارزميات التنقيب في البيانات 


؟- تحديد علاقات المبيعات بين المنتجات المختلفة (مع تحليل سلة السوق)؛ من أجل تحسين 
تخطيط المتجر وتحسين ترويج المبيعات. 

-٠"‏ مستويات الاستهلاك المتوقعة من أنواع مختلفة من المنتجات (على أساس الظروف الموسمية 
والبيئية) لتحسين النقل والإمداد. وبالتالي زيادة المبيعات. 

ع- اكتشاف أنماط مثيرة للاهتمام في حركة المنتجات (خاصةً بالنسبة للمنتجات التي لها فترة 
صلاحية محدودة؛ لأنها عُرْضة لانقضاء الصلاحية وقابلية الاستخدام والتلوث) في سلسلة 
التوريد من خلال تحليل بيانات التعرّف على الترددات اللاسلكية والحسية (RFID)‏ 

التصنيع والإنتاج: يمكن للمصنّعين استخدامٌ التنقيب في البيانات لكل من: 

-١‏ التنبؤ بفشل الآلات قبل حدوثها؛ من خلال استخدام البيانات الحسية (جمكين ما يُسِمّى 
الصيانة المستندة إلى الشروط). 

- تحديد الشذوذ والقواسم المشتركة في نظم الإنتاج؛ لتحسين القدرة التصنيعية. 

*- اكتشاف أنماط جديدة؛ لتحديد وتحسين جودة المنتج. 

- السّمسرة وتداول الأوراق المالية: يستخدم الوسطاءٌ والتجارٌ التنقيب في البيانات؛ من أجل: 

-١‏ التنبؤ بوقت ومقدار تغيّر أسعار السّندات. 

-١‏ التنبؤ بنطاق واتجاه تقلّبات الأسهم. 

- تقييم تأثير قضايا وأحداث مُعيّنة على حركات السوق ككل. 
-٤‏ تحديد ومَنْع الأنشطة الاحتيالية في تداول الأوراق المالية. 

- التأمين: تستخدم صناعة التأمين تقنيات التنقيب ق البيانات؛ من أجل: 

-١‏ توفع مبالغ المطالبة الخاصة بتكاليف الملكية والتغطية الطبية؛ لتحسين خطط الأعمال. 
۲- تحديد خطط الأسعار الى على أساس تحليل المطالبات وبيانات العملاء. 
۳- التنبؤ بالعملاء الأكثر احتمالًا لشراء سياسات جديدة ذات سمات خاصة. 
-٤‏ تحديد ومَنع مدفوعات المطالبة غير الصحيحة والأنشطة الاحتيالية. 
- أجهزة الحاسب والبرمجيات: يكن استخدامٌ التنقيب في البيانات في: 
-١‏ توقع حالات فشل مُحرك الأقراص قبل حدوثها Gled‏ 
؟- تحديد وتصفية محتوى الويب غير المرغوب فيه ورسائل البريد الإلكتروني. 
"- اكتشاف gig‏ ثغرات أمن شبكات الحاسب. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري وعم 


الفصل الرابع 


ع- تحديد منتجات البرمجيات غير الآمنة. 
- الحكومة والدفاع: يحتوي التنقيبٌُ في البيانات أيضًا على عدد من التطبيقات العسكرية. حيث 

يمكن استخدامه في: 

-١‏ توقع تكاليف نقل الأفراد والمعدَّات العسكرية. 

۲- التنبق بحركات الخَصّمء وبالتالي تطوير إستراتيجيات أكثر نجاحًا للارتباطات العسكرية. 

"- التنبؤ باستهلاك الموارد؛ لتحسين التخطيط والميزانية. 

ع- تحديد فئات من التجارب والإستراتيجيات والدروس المستفادة من العمليات العسكرية 
لتبادل المعرفة بشكلٍ أفضل في جميع أنحاء المنظمة. 

- صناعة السفر (شركات الطيرانء الفنادق/ المنتجعات» شركات تأجير السيارات): يُستخدم 

التنقيب في البيانات في العديد من مجالات صناعة السفر؛ إذ يتم استخدامها بنجاح في: 

-١‏ التنبؤ مبيعات الخدمات المختلفة (أنواع امقاعد ف الطائرات» أنواع الغرف في 
الفنادق/ امنتجعات» أنواع السيارات في شركات تأجير السيارات)؛ من أجل تسعير الخدمات 
على النحو الأمثل لزيادة الإيرادات إلى أقصى حَدٌّ كدالة للمعاملات المتغيرة مع الوقت (يُشار 
إليها عادةً باسم إدارة العائد). 

۲- توفع الطلب في مواقع مختلفة؛ من أجل تخصيص موارد تنظيمية محدودة بشكل أفضل. 

-٣‏ تحديد العملاء الأكثر ربحيةً وتزويدهم بالخدمات الشخصية؛ للحفاظ على أعمالهم المتكررة. 

ع- الاحتفاظ بالموظفين القيّمِين من خلال تحديد الأسباب الجذرية التي تؤدي إلى تناقص 
العملاء والتصرّف بناءً على ذلك. 

- الرعاية الصحية: يحتوي التنقيبٌ في البيانات على عدد من تطبيقات الرعاية الصحية؛ إذ يمكن 

il استخدامه‎ 

-١‏ تحديد الأشخاص الذين ليس لديهم تأمينٌ صحي والعوامل الكامنة وراء هذه الظاهرة غير المرغوبة. 

؟- تحديد علاقات التكلفة/ الفائدة الجديدة بين المعالجات المختلفة لتطوير إستراتيجيات أكثر فعالية. 

-٣‏ توفع مستوى ووقت الطلب في مواقع الخدمة المختلفة؛ لتخصيص الموارد التنظيمية على النحو الأمثل. 

ع- فهم الأسباب الكامنة وراء تناقص العملاء والموظفين. 

- الدواء: يجب النظرٌ إلى استخدام التنقيب في البيانات في الطب باعتباره مكملًا قيمًا للبحوث الطبية 
التقليدية» والتي هي أساسًا سريرية وبيولوجية في الطبيعة؛ إذ يمكن لتحليلات التنقيب في البيانات: 


yo.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): عملية» وطرق» وخوارزميات التنقيب في البيانات 


-١‏ تحديد أنماط جديدة لتحسين قابلية بقاء المرضى المصابين بالسرطان. 
۲- التنبؤ معدلات نجاح مرضى زرع الأعضاء لتطوير سياسات مطابقة أفضل للأعضاء. 
- تحديد وظائف الجينات المختلفة في الكروموسوم البشري (المعروف باسم علم الجينات). 
ع- اكتشاف العلاقات بين الأعراض والأمراض (وكذلك الأمراض والعلاجات الناجحة) لمساعدة 
المهنيين الطبيين في اتخاذ قرارات مستنيرة وصحيحة في الوقت المناسب. 
- صناعة أو مجال التسلية والترفيه: تستخدم صناعة الترفيه بنجاح عملية التنقيب في البيانات في: 
-١‏ تحليل بيانات sae LI‏ لتحديد البرامج التي يتم عرضها خلال وقت الذروة» وكيفية زيادة 
العائد من خلال معرفة مكان إدراج الإعلانات. 
-Y‏ توقع النجاح امالي للأفلام قبل aeta] ex Oi‏ لاتخاذ قرارات استثمارية وتحسين العائدات. 
"- التنبؤ بالطلب في أماكن مختلفة وأوقات مختلفة؛ من أجل تحديد مواعيد أفضل للأحداث 
الترفيهية وتخصيص الموارد على النحو الأمثل. 
ع- وَضْع سياسات تسعير مثالية لزيادة الإيرادات. 
- الأمن الداخاي» وتنفيذ القانون: يحتوي التنقيب في البيانات على عدد من تطبيقات أمن 
الأراضي وتطبيق القانون. وغالبًا ما يتم استخدام cada‏ في البيانات * 
-١‏ تحديد أنماط السلوكيات الإرهابية. (وللحصول على مثالٍ على استخدام التنقيب في البيانات 
لتتبّع مويل أنشطة الإرهابيين» انظر: الحالة العملية .)١-٤‏ 
blass] -Y‏ أنماط الجريمة (مثل: ال مواقع» والتوقيت» والسلوك الإجرامي» والسّمات الأخرى ذات 
الصّلة)؛ للمساعدة في حَل القضايا الجنائية في الوقت ال مناسب. 
*- التنبؤ بالهجمات البيولوجية والكيميائية المحتملة على البنية التحتية الحيوية للأمة والقضاء 
عليها عن طريق تحليل البيانات الحسّية ذات الأغراض الخاصة. 
€- تحديد وإيقاف الهجمات الضارة على الهياكل الأساسية الحيوية للمعلومات (غالبًا ما تُسمَّى 
حرب المعلوفات). 
- الرياضات: يُستخدم التنقيبٌ في البيانات لتحسين أداء فرق الرابطة الوطنية لكرة السلة 
È (NBA)‏ الولايات المتحدة؛ إذ تستخدم فرق البيسبول الرئيسية في الدوري التحليلات 
التنبؤية والتنقيب في البيانات؛ للاستفادة على النحو الأمثل من مواردها المحدودة 
لموسم الفوز (انظر: مقالة 3105:6211 في الفصل الأول). وفي الواقع؛ فإن معظم - إن 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري voy‏ 


الفصل الرابع 


لم يكن كل - الرياضات المحترفة في الوقت الحاضر توظف خبراء البيانات كما تستخدم التنقيب 
في البيانات لزيادة فرصهم في الفوز. ولا تقتصر تطبيقات التنقيب في البيانات على الرياضات 
الاحترافية. ففي مقالة عام ؟١١م؛‏ قام zhu Kasap (2012)  Cogdells Delen ¿ys js‏ 
نماذج التنقيب في البيانات للتنبؤ بنتائج الرابطة الرياضية الجامعية الوطنية (510424) ونتائج 
لعبة الكرة باستخدام مجموعة واسعة من المتغيرات حول إحصائيات الألعاب السابقة للفريقين 
المتعارضين (مزيدٌ من التفاصيل حول هذا يتخ توفير دراسة الحالة في الفصل الثاني). وقد 
استخدم (2012) ؛اع111 مجموعةً متنوعةً من المتنبئين لفحص دوري بطولة كرة السّلة 


للرجال في الرابطة الوطنية لأمريكا الشمالية (a.a. March Madness)‏ 


yoy 


Y-t äl äl 
التحليل التنبؤي والتنقيب في البيانات يساعدُ في وقف تمويل الإرهاب‎ 

$i‏ الهجومٌ الإرهابي على مركز التجارة العالمي في ١١‏ سبتمبر ١١٠7م:‏ على أهمية 
الذكاء المفتوح المصدر. وقد أعلن قانون الوطنية الأمريكية وإنشاء وزارة الأمن الداخلي 
الأمريكية عن احتمالية لتطبيق تقنية المعلومات وتقنيات التنقيب في البيانات؛ للكشف 
عن غسيل الأموال والأشكال الأخرى لتمويل الإرهاب. وتركّز وكالات إنفاذ القانون 
على أنشطة غسل الأموال عن طريق ال معاملات العادية من خلال المصارف وغيرها من 
منظمات الخدمات امالية. وترگز وكالات إنفاذ القانون الآن على تسعير التجارة الدولية 
كأداة لتمويل الإرهاب. وقد استخدم تجار غسيل الأموال التجارة الدولية؛ لنقل الأموال 
بصمت خارج البلاد دون جذب انتباه الحكومة. يتم تحقيق هذا التحويل عن طريق 
المبالغة في تقدير الواردات وانخفاض قيمة الصادرات. فمثلًا يمكن للمستورد المحلي 
والمْصَدّر الأجنبي أن يشكلا شراكةٌ ويتجاوزا قيمة الواردات» وبالتالي تحويل الأموال من 
البلد الأم؛ مما يؤدي إلى جرائم تتعلق بالاحتيال الجمركي» والتهرّب من ضريبة الدخلء 

وغسيل الأموال. ويمكن أن يكون المُصدَّر الأجنبي عضوًا في منظمة إرهابية. 
وترگز تقنيات التنقيب في البيانات على تحليل البيانات المتعلّقة بمعاملات الاستيراد 
والتصدير من وزارة التجارة الأمريكية والكيانات المرتبطة بالتجارة. ويتم تتبّع أسعار 
الواردات التي تتجاوز الحَدَّ الأقصى لأسعار الواردات ربع السنوية: وأسعار التصدير 
التي تقل عن الحَدَّ الأدنى من أسعار التصدير ربع السنوية. وينصبٌ التركيز على 
أسعار التحويل غير الطبيعية بين الجلسات التي قد تؤدي إلى تحويل الدخل والضرائب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): عملية» وطرق» وخوارزميات التنقيب في البيانات 


الخاضعة للضريبة من الولايات المتحدة. وقد يكون الانحراف المرصود في الأسعار ناتجًا 
عن تجنّب/ تهرّب ضريبة دخلء أو غسيل أموال أو تمويل إرهاب. وقد يرجع الانحراف 
السعري المرصود أيضًَا إلى خطأ في قاعدة بيانات التجارة الأمريكية. 

وجديرٌ Sb‏ أن التنقيب في البيانات سوف يؤدي إلى تقييم فعّال للبيانات» وهو 
ما سيساعد بدوره في مكافحة الإرهاب. كما هكن آن يُسهم تطبيق تقنية المعلومات 
وتقنيات التنقيب في البيانات في المعاملات المالية في تحسين المعلومات الاستخبارية. 

أسئلة للمناقشة: 

-١‏ كيف ممكن استخدامٌ التنقيب في البيانات لمكافحة الإرهاب؟ اذكر ما يمكن القيامٌُ 
به أيضًا غير ما تضمَّنته هذه الحالة العملية. 

-٠‏ هل تعتقد أن التنقيب في البيانات: رغم أنه ضروريّ لمحاربة الخلايا الإرهابية, 
يُهرّد أيضًا حقوق الأفراد في الخصوصية؟ 
Sources: Zdanowic, [. S. (2004, May). Detecting money laundering and terrorist‏ 


financing via data mining. Communications of the ACM, 47(5), 53; Bolton, R. J. 
(2002, January). Statistical fraud detection: A review. Statistical Science, 17(3), 235. 


أسئلة للمراجعة على القسم Y-t‏ 

-١‏ ما هي مجالات التطبيق الرئيسة للتنقيب في البيانات؟ 

a45 -Y‏ على الأقل خمسة تطبيقات مُحدَّدة للتنقيب في البيانات» واذكر خمسة تصنيفات مشتركة 
لهذه التطبيقات. 

- ما هو برأيك مجالٌ التطبيق الأبرز للتنقيب في البيانات؟ وطاذا؟ 

»- هل ممُكنك التفكيرٌ في مجالات تطبيق أخرى للتنقيب في البيانات م تتم مناقشتها في هذا 
القسم؟ «uà‏ 


٤-٤‏ عملية التنقيب في البيانات: 


ole‏ ما يتم اتباع طريقة شائعة للقيام بمشاريع التنقيب في البيانات بشكل منهجي. واستنادًا 
إلى أفضل الممارسات؛ قام الباحثون والممارسون في مجال التنقيب في البيانات باقتراح عدة عمليات 
(سَيْر عملء أو مقاربات بسيطة خطوة بخطوة)؛ لزيادة فرص النجاح في تنفيذ مشاريع التنقيب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yor‏ 


الفصل الرابع 


في البيانات. وقد دت هذه الجهود إلى العديد من العمليات القياسيةء وفي هذا القسم سنذكر 
وَصّْف بعضها (عدد قليلٌ من أكثر هذه العمليات شيوعًا). 

وقد تمَّ اقترا إحدى هذه العمليات الموخّدة» التي يمكن اعتبارها الأكثر شيوعًاء وهي عمليةٌ 
قياسيةٌ عبر صناعة التنقيب في البيانات (08:558-211) في منتصف التسعينيات من قبل الاتحاد 
الأوروبي للشركات للعمل كمنهجية غير مسجّلة الملكية للتنقيب في البيانات CRISP-DM,)‏ 
3. ويوضّح الشكل ١-6‏ هذه العملية المقترزحة. وهي سلسلة من ست خطوات تبدأ بِقَهُم 
جيدٍ للأعمال والحاجة إلى مشروع التنقيب في البيانات (أيّ: مجال التطبيق) وتنتهي بنشر الحل 
الذي يلبّي المتطلبات اللمحَدَّدة لاحتياجات العمل. وعلى الرغم من أن هذه الخطوات متسلسلةٌ 
في الطبيعة: غير أنه عادةً ما يكون هناك قدرٌ كبيرٌ من التراجع. ونظرًا لأن التجربة والخبرة؛ هي 
التي تُحرّك التنقيب في البيانات: وفقًا لحالة المشكلة والمعرفة/ خبرة المحلل؟ فإنه من الممكن أن 
تكون العملية بِرْمّتها متكرّرة للغاية (على سبيل المثال: يجب على المرء أن يتوقع أن يتنقل من 
خلال الخطوات عدة مرات) وتستغرق وقتاً طويلاً. ونظرًا؛ لأن الخطوات اللاحقة مبنيةٌ على نتائج 
الاختبارات السابقة؛ فإنه يجب على ال مرء أن يولي اهتمامًا إضافيًا للخطوات السابقة؛ من أجل عدم 
وضُع الدراسة بالكامل على مسار غير صحيح منذ البداية. 











:Y-€ JS‏ عملية 018155-11 ذات الست خطوات للتنقيب في البيانات 


vot‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التنبؤية (1): عملية» وطرقء وخوارزميات التنقيب في البيانات 


الخطوة -١‏ فهم الأعمال: 

إن العنصر الرئيس في أيّ دراسة للتنقيب ف البيانات؛ هو معرفة ماهية الدراسة. وتبدأ 
الإجابة عن هذا السؤال بِقَهُمِ شامل للحاجة الإدارية للمعرفة الجديدة ومواصفات صريحة لهدف 
العمل فيما يتعلق بالدراسة التي سيتمٌ إجراؤها. فنحن بحاجة إلى أهداف مُحدّدة مثل: lo»‏ 
هي الخصائص المشتركة للأفراد الذين فقدناهم لمنافستنا في الآونة الأخيرة؟» أو «ما هي EMI‏ 
النموذجية لأعوانناء وكم القيمة التي يوفرها كل منهم لنا؟». ثم يتم تطويرٌ خطة مشروع لإيجاد 
مثل هذه المعرفة التي MEN‏ المسؤولين عن جمع البيانات» وتحليل البيانات» والإبلاغ 
عن النتائج. وفي هذه المرحلة المبكرة؛ يجب أيصًا إنشاء ميزانية لدعم الدراسة. على الأقل عند 
مستوى عالٍ مع أرقام تقريبية. 


الخطوة ۲- فهم البيانات: 

إنَّ دراسة التنقيب في البيانات مُخصّصة للتصَّدَّي لمهمة عمل مُحدّدة تحديدًا جيدًا. وتتطلّب 
مهام العمل المختلفة مجموعات مختلفةً من البيانات. وبعد فهم الأعمال؛ فإن النشاط الرئيس 
لعملية التنقيب في البيانات يتمثل في تحديد البيانات ذات الصّلة من العديد من قواعد البيانات 
المتاحة. ويجبٌ النظر في بعض النقاط الأساسية في مرحلة تحديد البيانات واختيارها. ويجبُ Jj‏ 
«ees US Js‏ أن يكون المحللٌ واضحاً وموجرًا حول وَصْف مهمة التنقيب في البيانات؛ بحيث 
oues 954‏ البيانات الأكثر صلةً. فعلى سبيل المثال: قد يسعى مشروعٌ استخراج بيانات تجارة 
التجزئة إلى تحديد سلوكيات الإنفاق للمتسؤّقات الإناث اللاتي يقمن بشراء الملابس الموسمية على 
أساس التركيبة السكانية: ومعاملات بطاقات الائتمان» والسّمات الاجتماعية والاقتصادية. علاوةً 
على ذلك؛ يجبٌ على ا محلّل بناءٌ فهم واع مصادر البيانات (مثل: أين يتم تخزينْ البيانات ذات 
العلاقة؟ iS às‏ شكل؟ وما هي عملية جَمّع البيانات - الآلي مقابل اليدوي - ومَنْ هم جامعو 
البيانات؟ وكم مرةً يتح تحديث البيانات؟) والمتغيرات (مثل: ما هي المتغيرات الأكثر ملاءمة؟ 
هل هناك أي متغيّرات مترادفة أو متشابهة؟ هل المتغيّرات مستقلةً بعضها عن بعض؟ هل تقف 
كمصدر معلومات كامل دون تداخل أو تعارض معلومات؟). 

ولفهم البيانات بشكلٍ أفضل؛ فإنه غالبًا ما ييستخدم المحللٌ مجموعةً متنوعةً من التقنيات 
الإحصائية والرسومية» مثل: ملخصات إحصائية بسيطة لكلّ متغير (فمثلًا: للمتغيرات الرقمية 
متوسطّ يُشكّل كلاً من الحَدَّ الأدنى أو الأقصى والوسيط والانحراف المعياري المقاييس المحسوبة؛ في 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yoo‏ 


الفصل الرابع 


حين أنه بالنسبة للمتغيرات الفئوية» فإنه يتم Olas‏ جداول الشكل والتردد)» وتحليل الارتباطء 
وقطاعات الانتشار والمدرج الإحصايء ومؤشرات الصندوق. إن التحديد الدقيق لمصادر البيانات 
واختيارها والمتغيرات الأكثر ملاءمةً تكن أن تسهل على خوارزميات التنقيب في البيانات اكتشاف 
أنماط المعرفة المفيدة بسرعة. 

وتمكن أن تتنوعَ مصادر البيانات؛ من أجل انتقاء البيانات. ومن الناحية التقليدية؛ فإن 
مصادر البيانات لتطبيقات الأعمال تشمل كلاً مما يأقي: البيانات الدموغرافية (مثل: الدخل 
التعليم: (yaly JLL ase‏ والبيانات الاجتماعية (مثل: الهوايات» وعضوية الناديء والترفيه)» 
وبيانات المعاملات (كسجل المبيعات» والائتمان إنفاق البطاقةء والشيكات المصدرة)» وما إلى ذلك. 
وفي الوقت الحاضر؛ فإن مصادر البيانات تستخدم أيضًا مستودعات البيانات الخارجية (المفتوحة 
أو التجارية)» ووسائط الإعلام الاجتماعية» والبيانات المُنشأة آليّاء 

كما يكن تصنيف البيانات على أنها كميةٌ ونوعية؛ إذ يتم قياس الكمية باستخدام القيم 
الرقمية: أو البيانات الرقمية. وقد تكون منفصلةً (مثل: الأعداد الصحيحة) أو مستمرة (مثل الأرقام 
الحقيقية). وتحتوي البيانات النوعية» وا معروفة أيصًا بالبيانات الفثويةء على البيانات الاسمية 
والترتيبية. فالبيانات الاسمية لها قيمٌ غير مرتبة مُحدّدة (على JEL Jew‏ بيانات النوع الاجتماعي» 
التي لها قيمتان: ذكورٌ وإناث). البيانات الترتيبية لديها قِيمٌ مُحدَّدة منتهية. على سبيل المثال: 355 
تقييمات العملاء الائتمانية بيانات ترتيبية؛ لأن التقييمات يمكن أن تكون ممتازة وعادلة كما يمكن 
أن تكون سيئةً. وقد وَرَدَ في الفصل ١‏ تصنيفٌ Gİ) OLLI huy‏ طبيعة البيانات). 

ويكن تمثيل البيانات الكمية بسهولة عن طريق نوع من توزيع الاحتمالات؛ إذ يّصف BIS‏ 
الاحتمالات كيف يتخ تشتيت البيانات وتشكيلها. فعلى سبيل المثال:. عادةٌ ما تكون البيانات 
الموزّعة متماثلة ويُشار إليها عادةً على أنها منحنى على شكل جرس. كما يمكن تشفيرٌ البيانات 
النوعية إلى أرقام ثم وَصْفها من خلال توزيعات التردد. وبمجرد اختيار البيانات ذات الصّلة وفقاً 
لهدف الأعمال التجارية للتنقيب في البيانات» يجب متابعة معالجة البيانات. 


الخطوة "- إعداد البيانات: 

إِنَّ الغرض من إعداد البيانات (والذي يُطلّق عليه عادةً اسم ال معالجة الأوّلية للبيانات) هو 
أَخْذْ البيانات المحَدّدة في الخطوة السابقة وإعدادها للتحليل بواسطة طرق التنقيب في البيانات. 
ومقارنةً بالخطوات الأخرى في 028158-2121؛ فإن المعالجة المُسبّقة للبيانات تستهلك معظم 
الوقت والجهد؛ ويعتقد الكثيرون أنَّ هذه الخطوة تمثل ما يقرب من ۸٠‏ من إجمالي الوقت 


yor‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عملية وطرق» وخوارزميات التنقيب في البيانات 


الذي يقضيه في مشروع التنقيب في البيانات. والسبب في هذا الجهد الهائل الذي يتم إنفاقه على 
هذه الخطوةء هو حقيقة أن بيانات العالم الحقيقي غير مكتملة بشكل عام (أَيْ: تفتقر إلى قيم 
e‏ أو تفتقر إلى سمات مُعيّنة للاهتمام. أو تحتوي على بيانات مُجمّعة فقط) أو صاخبة 
(أيْ: تحتوي على أخطاء أو أخطاء خارجية)» وغير متناس قة (أيْ: تحتوي على تناقضات في الرموز 
أو الأسماء). وقد ورد شرحٌ طبيعة البيانات والمسائل المتعلّقة بعمليات ال معالجة الْسبَقة لبيانات 


التحليلات بالتفصيل في الفصل الثاني. 
الخطوة 6- بناء النماذج: 

وفي هذه الخطوة يتم اختيارٌ تقنيات النمذجة المختلفة وتطبيقها على مجموعة بيانات تمّ 
إعدادها بالفعل لتلبية احتياجات العمل امحَدَّدة. وتشتمل خطوة بناء النموذج أيضًا على التقييم 
والتحليل المقارن لمختلف النماذج المبنية. ونظرًا لعدم وجود طريقة أو خوارزمية أفضل معروف 
عايًا لمهمة التنقيب في البيانات؛ فإنه يجب على المستخدم استخدامٌ مجموعة متنوعة من أنواع 
النماذج القابلة للتطبيق جنباً إلى جنب مع إستراتيجية تقييم وتجربة مُحدَّدة تحديدًا جيدًا 
لتحديد الطريقة «الأفضل» لغرض معين. وحتى بالنسبة لطريقة واحدة أو خوارزمية واحدة؛ 
فإنه يجبُ تحديدٌ عدد من المعلمات للحصول على أفضل النتائج. وقد تحتوي بعص الأساليب 
على متطلبات مُحدّدة في الطريقة التي يتم بها تنسيق البيانات؛ وبالتالي؛ فإن العودة إلى خطوة 
إعداد البيانات تكون ضروريةً في كثير من الأحيان. وتقدّم الحالة العملية ٤-٤‏ دراسةً بحثيةً يتم 
فيها تطوير Sas‏ من أنواع النماذج ومقارنتها بعضها ببعض. 

وتبعًا لاحتياجات العمل؛ فإنه تمكن أن تكون مهمة التنقيب في البيانات للتنبؤ (إما التصنيف 
أو الانحدار) أو اقتران أو نوع تجميع. كما تكن لكل من هذه المهام التنقيب في البيانات من 
خلال استخدام مجموعة متنوعة من الخوارزميات وأساليب التنقيب في البيانات. وقد تناولنا 
شرح بعض طرق التنقيب في البيانات في جزء سابق من هذا الفصل؛ وسوف نتناول لاحقًا في هذا 
الفصل وَصْف بعض أكثر الخوارزميات استخدامًاء l‏ في ذلك شجرات القرار للتصنيف» وقصهء د11 
لتجمع الحلول» وخوارزمية 11011م4 لاستخراج قواعد الارتباط. 


الخطوة 0- الاختبار والتقييم: 
في هذه الخطوة؛ يتم تحديدٌُ وتقييمُ النماذج المتقدّمة من حيث دقتها وجدارتها؛ إذ تقوم هذه 
الخطوة بتقييم الدرجة التي يُلبّي بها النموذج (أو النماذج) المحَدّدة أهداف العملء وإذا كان الأمرٌ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yov‏ 


الفصل الرابع 


كذلك؛ فإلى أيّ مدى (أيْ: هل هناك حاجة إلى تطوير المزيد من النماذج وتقييمها؟). وهناك خيارٌ 
آخرء وهو اختبارٌ النموذج (أو النماذج) المتقدّم في سيناريوهات العام الحقيقي في حالة ما إذا كانت 
قيود الوقت والميزانية تسمح. وعلى الرغم من أنه من المتوقع أن ترتبط نتائج النماذج المتقدّمة 
بأهداف العمل الأصلية؛ فإنَّ النتائج الأخرى التي لا ترتبط بالضرورة بأهداف العمل الأصليةء قد 
تكشف النقاب عن معلومات إضافية أو تلميحات للاتجاهات المستقبلية التي يتم اكتشافها. 
X ss‏ خطوة الاختبار والتقييم مهمة حرجةٌ وصعبة؛ إذ يتم إضافة أي قيمة بواسطة مهمة 
التنقيب في البيانات؛ حتى يتم التعرف على قيمة الأعمال التي تم الحصولٌ عليها من أنماط المعرفة 
المكتشفة والتعرف عليها. فتحديد القيمة التجارية من أنماط المعرفة المكتشفة يشبه إلى حَدَّ ما 
لعب الألغاز. وأنماط المعرفة المستخلصة؛ هي أجزاءٌ من اللغز والتي يجبٌ أن يتمّ تجميعها في سياق 
غرض العمل المحَدّد. ويعتمد نجاح عملية تحديد الهوية على التفاعل بين مُحللي البيانات ومُحللي 
الأعمال وصانعي القرار (مثل مديري الأعمال). ونظرًا ix oS‏ البيانات قد لا يكون لديهم الفهم 
الكامل لأهداف التنقيب في البيانات وما يعنيه لرجال الأعمالء ومُحلَّلي الأعمال» كما أن صانعي 
القرار قد لا يكون لديهم المعرفة التقنية لتفسير نتائج الحلول الرياضية المعقدة؛ ولذلك فإن التفاعل 
بينهم أمرٌ ضروري. ولتفسير أنماط المعرفة بشكلٍ صحيح؛ غالبًا ما يكون من الضروري استخدام 
مجموعة متنوعة من تقنيات الجدولة والتصور (على سبيل المثال: الجداول ال محوريةء الجدولة 
المتقاطعة للنتائج» المخططات الدائرية» المدرج التكراريء مخططات الأرضء نقاط التشتت). 


الخطوة 5- النّشر: 

إن تطويرَ وتقييم النماذج ليس نهاية مشروع التنقيب في البيانات. وحتى إن كان الغرض من هذا 
النموذج هو الحصول على استكشافٍ بسيط للبيانات؛ فإن المعرفة اممكتَسَبة من مثل هذا الاستكشاف 
ستحتاج إلى تنظيم وتقديمها بطريقة تجعل المستخدم النهائي قادرًا على فهمها والاستفادة منها. وبناءً 
على المتطلبات؛ فإن مرحلة النشر قد تكون بسيطةً مثل إنشاء تقرير أو معقدة, مثل تنفيذ عملية 
التنقيب ف البيانات القابلة للتكرار عبر المؤسسة. وف العديد من الحالات؛ يكون العميلء وليس 
Obh Jih‏ هو الذي يُنَقّدْ خطوات النشر. ومع ذلك فحتى إذا م يقم ال محلل بتنفيذ جهد النشر؛ 
Gall as‏ أن يفهم العميلٌ في البداية ما هي الإجراءات التي يتعيّن القيام بها لاستخدام النماذج التي 
تم إنشاؤها فعليًا. وقد تتضمّن خطوة النشر أيضًا أنشطة الصيانة للنماذج التي تمّ نشرها. نظرًا 
لأن كلّ شيءٍ يتعلق بالأعمال يتغير باستمرار؛ فإن البيانات التي تعكسٌ أنشطة الأعمال تتغير أيضّاء 
وبمرور الوقت؟ قد تصبح النماذج (والأنماط المضمّنة بها) المبنية على البيانات القدهة عتيقة أو غير 


YOA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عملية وطرق» وخوارزميات التنقيب في البيانات 


ذات صلة أو مضللة. ولذلك فمن المهمٌ مراقبة النماذج وصيانتها إذا أصبحت نتائج التنقيب في 
البيانات جزءًا من الأعمال اليومية وبيئتها. ويساعد الإعدادٌ الدقيق لإستراتيجية الصيانة على تجنب 
فترات طويلة غير ضرورية من الاستخدام غير الصحيح لنتائج التنقيب في البيانات. ومراقبة نشر 
نتيجة (نتائج) التنقيب في البيانات» يحتاج المشروع إلى خطة laih‏ حول عملية المراقبة» والتي قد 
لا تكون مهمةً بسيطةً بالنسبة لنماذج التنقيب في البيانات اللمعقدة. 


حالة عملية ٤-٤‏ 
يساعد التنقيب في البيانات في أبحاث السرطان 

وفقاً لجمعية السرطان الأمريكية؛ فإن نصف الرجال وثلث النساء في الولايات 
المتحدة الأمريكية سيصابون بالسرطان خلال حياتهم؛ ومن المتوقع أن يتم 
تشخيص ١,0‏ مليون حالة سرطان جديدة في عام aY-‏ وَيُعَدُ السرطان هو ثاني 
أكثر أسباب الوفاة شيوعًا في الولايات المتحدة والعالم» ولا يتجاوزه سوى أمراض 
القلب والأوعية الدموية فقط. ومن المتوقع في هذا العام أن يموت أكثر من 
أمريكي بسبب السرطان - وهذا يعني أكثر من ١7٠١‏ شخص في اليوم - 
وهو ما هثل حالة وفاة واحدة من كلّ أربع حالات. 

والسرطان هو مجموعةٌ من الأمراض يتم تمثيلها بشكلٍ عام عن طريق النمو 
غير المنضبط وانتشار الخلايا غير الطبيعية. وإذا لم يتم التحكّم في النمو و/ أو 
الانتشار؛ فقد يؤدي ذلك إلى الوفاة. على الرغم من عدم معرفة الأسباب الدقيقة, 
ومن المعتقد أن السرطان ناتج عن عوامل خارجية (مثل: التبغ؛ والكائنات المعدية, 
والكيميائية. والإشعاعية) والعوامل الداخلية (مثل: الطفرات الوراثيةء والهرمونات 
والظروف المناعية والطفرات التي تحدث بسبب التمثيل الغذائي). وقد تعمل 
هذه العوامل السّببية معًا أو في تسلسلٍ لبَدْء أو تعزيز التسرطن. ويتم التعامل 
مع السرطان بالجراحة» والإشعاع» والعلاج الكيمياي» والعلاج بالهرمونات» والعلاج 
البيولوجيء والعلاج الموجَّه. وتختلف إحصاءات البقاء على قيد الحياة بشكلٍ كبيرٍ 
حسب نوع السرطان ومرحلة التشخيص. 

إِنَّ معدّل البقاء على قيد الحياة لمدة ه سنوات لجميع السرطانات آخدٌ في 
التحشّنء كما أن معدل وفيات السرطان قد انخفض إلى “١‏ في عام 17 .لام 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yos‏ 


الفصل الرابع 


وهو ما أذَّى إلى تجنّبٍ حولي 1.7 مليون حالة وفاة بسبب السرطان منذ 
عام ١199م.‏ ويعني هذا أن أكثر من 6٠١‏ شخص يتم إنقاذهم يوميًا! ويعكس 
التحسّن الذي طرأ على عدد الأشخاص الذين يتم إنقاذهم مدى التقدّم في 
تشخيص بعض أنواع السرطان في مرحلة مبكرة والتحسينات في العلاج. غير أننا 
ما زلنا بحاجة إلى مزيد من التحسينات لمنع وعلاج السرطان. 

وعلى الرَّعْم من أن أبحاث السرطان كانت ذات طابع سريريٌّ وبيولوجي في 
العادة؛ فإن الدراسات التحليلية المستندة إلى البيانات ial‏ مُكمّلًا شائعًا في 
السنوات الأخيرة. وقد تمَّ تحديدٌ اتجاهات البحوث الجديدة في المجالات الطبية؛ 
إذ تمّ تطبيق الأبحاث التي تعتمدٌ على البيانات والتحليلات بنجاح؛ وذلك من 
أجل تعزيز الدراسات السريرية والبيولوجية. وقد تمكّن الباحثون من تحديد 
أنماط جديدة باستخدام أنواع مختلفة من البيانات» ها في ذلك البيانات التجريبية 
الجزيئية: والسريرية: والمرتكزة على الأدبيات (الكتابات التي كُتبت في هذا 
الموضوع). ومعلومات التجارب السّريرية إلى جانب أدوات وتقنيات التنقيب في 
البيانات المناسبة» وقد تمكّن الباحثون من تحديد أنماط جديدة؛ مما بممّد الطريق 
نحو مجتمع خالٍ من السرطان. 

s‏ إحدى الدراسات استخدم (2009) 106162 ثلاث تقنيات شائعة للتنقيب 
في البيانات؛ وهي: (أشجار القرارء والشبكات العصبية الاصطناعيةء وآلة ا متجهات 
الداعمة) بالتزامن مع الانحدار اللوجستي (المنطقي) لتطوير نماذج التنبؤ للقدرة 
على البقاء مع وجود سرطان البروستاتا. وقد تضمّتَت مجموعة البيانات حوالي 
٠,۰۰۰‏ سجل و۷۷ متغيرًا. كما تم استخدام منهجية التحقق المتقاطع س - جزء 
(1-1014) في بناء النماذج والتقييم والمقارنة. وقد أوضحت النتائجٌ أن نماذج 
المتجهات الداعمة؛ هي الأكثر دقة (مع دقة ضبط تبلغ 917,80/) لهذا المجال» 
تليها الشبكات العصبية الاصطناعية وأشجار القرار. وعلاوةً على ذلك؛ وباستخدام 
طريقة تقييم تعتمد على الحساسية - التحليلية» كشفت الدراسة bhii os lj‏ 
جديدة تتعلق بالعوامل التي تُنَذِر بوجود سرطان البروستاتا. 

وفي دراسة ذات «Kadam (2005) 5 Walkers Delen ġa jS l3 ea&zal Le‏ 
اثنين من خوارزميات استخراج البيانات» وهي: (الشبكات العصبية الاصطناعية. 


e‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية dalos :)١(‏ وطرق» وخوارزميات التنقيب في البيانات 


وأشجار القرار) والانحدار اللوجستي (المنطقي) لتطوير نماذج التنبؤ لبقاء سرطان 
الثدي باستخدام مجموعة كبيرة من البيانات (أكثر من ۲٠٠,٠٠١‏ حالة). وباستخدام 
منهجية التحقق المتقاطع المكوّنة من ٠١‏ أجزاء لقياس التقدير غير المتحيّز لنماذج 
التنبؤ لأغراض مقارنة الأداء - أشارت النتائجٌ إلى أن شجرة القرارات (خوارزمية 5©) 
كانت أفضل طريقة تنبق مع دقة 91,7“ على العينة المخالفة (والتي كانت أفضل 
طريقة تنبؤ ذُكرت في الأدبيات)» تليها الشبكات العصبية الصناعيةء مع دقة 
۲ والانحدار اللوجستي (منطقي)» مع دقة ۸۹,۲. وقد كشف ال مزيدٌ من 
التحليل لنماذج التنبؤ عن أهمية تنبؤات العوامل» والتي هكن استخدامها بعد 
ذلك كأساس لمزيد من الدراسات البحثية السريرية والبيولوجية. 

وفي الدراسة الأخيرة؛ قام كلَّ 3 Zadeh (2015) .Delens Zolbanin‏ 
بدراسة تأثير الاعتلال المشترك في البقاء على قَيْد الحياة للسرطان. وعلى الرغم من 
أن الأبحاث السابقة أظهرت أن التوصيات التشخيصية والعلاجية يمكن أن تتغير 
Elo‏ على شدة الأمراض المصاحبة» غير أن الأمراض المزمنة لا تزال قيد البحث بمعزل 
بعضها عن بعض في معظم الحالات. ولتوضيح أهمية الأمراض المزمنة المتزامنة 
في أثناء العلاج؛ فقد استخدمت دراستهم المراقبةء وعلم الأوبئة. والنتائج النهائية 
(558810) لإنشاء مجموعتين من البيانات الكرضية: إحداهما لسرطانات الثدي 
والأعضاء التناسلية للإناث: والأخرى لسرطانات البروستاتا والسرطانات البولية. 
ثم يتم تطبيق العديد من تقنيات تعلّم الآلة الشائعة على مجموعات البيانات 
الناتجة لبناء نماذج تنبؤية (انظر: شكل 6-6). وقد أظهرت مقارنة النتائج أن 
الحصول على مزيدٍ من المعلومات حول الحالات المرضية للمرضى يمكن أن يحسّن 
من القدرة التنموية لدى النماذجء والتي بدورها يمكن أن تساعد الممارسين على 
اتخاذ قرارات أفضل في التشخيص والعلاج. ولذلك؛ فقد اقترحت الدراسة أن 
التحديد السليم وتسجيل واستخدام حالة الاعتلال المشترك للمرضى يمكن أن يقلل 
تكاليف العلاج ويخفف من التحَدَّيات الاقتصادية المتعلقة بالرعاية الصحية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري نضا 


gil! الفصل‎ 


is =‏ الح 





|«الإختيار 
بيانات مقسمة d‏ بيانات مقسمة 
(التدريب والإختبار) ‏ .. 4 (التدريب والإختبار) 
بيانات مقسمة 
(التدريب والإختبار), 











وتظهر هذه الأمثلة (ضمن العديد من الدراسات الأخرى ف الأدبيات الطبية) أنه 
يكن استخدام تقنيات دقيقة للبيانات المتقدّمة لتطوير نماذج تمتلك درجةٌ عاليةٌ 
من القدرة التنبؤية والتفسيرية. وعلى الرغم من أن أساليب التنقيب في البيانات 
قادرةٌ على استخراج الأنماط والعلاقات اللخبّأة في أعماق قواعد البيانات الطبية 
الكبيرة والمعقّدةء دون التعاون والتغذية المرتدة من الخبراء الطبيين؛ فإن نتائجها 
ليست مفيدةً بشكلٍ كبير؛ إذ يجبٌ تقييم الأنماط الموجودة عبر أساليب التنقيب 
في البيانات من قبل المتخصّصين في المجال الطبي الذين لديهم سنوات من الخبرة 
في مجال المشكلة؛ لتحديد ما إذا كانت منطقيةً وقابلةَ للتطبيق ومبتكرةً بما يكفي 


nr‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التنبؤية dalos :)١(‏ وطرق» وخوارزميات التنقيب في البيانات 


لتبرير اتجاهات بحثية جديدة. وباختصار؛ فإنه لا يُّقصَّد من التنقيب في البيانات 
أن تحلّ محل المهنيين والباحثين المتوسطين؛ بل تجمع جهودهم التي لا تُقدّر 
بثمن لتوفير اتجاهات بحثية جديدة مدفوعة بالبيانات ولإنقاذ المزيد من الأرواح 
البشرية في نهاية المطاف. 

أسئلة للمناقشة: 

-١‏ كيف يمكن استخدامٌ التنقيب في البيانات لعلاج الأمراض في نهاية المطاف 
مثل السرطان؟ 

؟- ما هي في اعتقادك الوعود والتحَدّيات الكبرى التي يواجهها العاملون في 
مجال التنقيب في البيانات للمساهمة في الجهود البحثية الطبية والبيولوجية؟ 
Sources: Zolbanin, H. M., Delen, D., & Zadeh, A. H. (2015). Predicting overall‏ 
survivability in comorbidity of cancers: A data mining approach. Decision Support‏ 
Systems, 74, 150161-; Delen, D. (2009). Analysis of cancer data: A data mining‏ 
approach. Expert Systems, 26(1), 100112-; Thongkam, J., Xu, G., Zhang, Y., & Huang,‏ 
E. (2009). Toward breast cancer survivability prediction models through improving‏ 
training space. Expert Systems with Applications, 36(10), 1220012209-; Delen, D.,‏ 


Walker, G., & Kadam, A. (2005). Predicting breast cancer survivability: A comparison 
of three data mining methods. Artificial Intelligence in Medicine, 34(2), 113127-. 


عمليات ومنهجيات أخرى مُوخَّدة للتنقيب في البيانات: 

ولكي يتمّ تطبيقها بنجاح؛ فإنه يجبٌ النظر إلى دراسة التنقيب في البيانات على أنها عملية تتبع 
منهجية واحدة بدلا من مجموعة من أدوات وتقنيات البرامج الآلية. فإضافةً إلى ‘CRISP-DM‏ 
هناك منهجيةٌ أخرى معروفة تمّ تطويرها من قبل معهد 545: وتُسمَّى )2009( SEMMA‏ |3 
يشيرٌ اختصار 582/11/14 إلى «العينة» والاستكشافء والتعديل» والطراز والتقييم». 

وبدءًا من عيّنة من البيانات تمَّ تمثيلها إحصائيًً؛ فإِنَّ 5531314 يجعلٌ من السهل تطبيق 
الأساليب الاستكشافية الإحصائية والتصويرء وتحديد وتحويل أهمٌ المتغيّرات التنبؤية» وتهيئة 
المتغيّرات للتنبؤ بالنتائج» وتأكيد دقة النموذج. وهناك تمثيلٌ مُصوّر ل 5821/14 في الشكل 0-6. 
ومن خلال تقييم نتائج JS‏ مرحلة من مراحل عملية 553114؛ يمكن لمطوّر النموذج تحديد 
كيفية صياغة أسئلة جديدة تثيرها النتائج السابقة. وبالتالي» العودة إلى مرحلة الاستكشاف 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري nr‏ 


gil! الفصل‎ 


من أجل تحسين البيانات بشكل أفضل؛ وذلك كما هو euo 3 .CRISP-DM ga JlaJl‏ تشغيلٌ 
14 بدورة تجريبية متكررة للغاية. ويتمثل الفرق الرئيس بين SEMMA s .CRISP-DM‏ 
في أن 08152-221 يتخذ منهجًا أكثر شموليةً - بما في ذلك فهم الأعمال والبيانات ذات الصّلةَ 
- بالقياس بمشروعات التنقيب في البيانات» في حين يفترض 5152/11/4 ضمنيًا أن أهداف وغايات 
مشروع التنقيب في البيانات تكون معًا جنبًا إلى جنب مع تحديد مصادر البيانات المناسبة وفهمها. 











إستكشاد 
تصوير البيانات 
وتوصيفها الرئيس 
إختيار المتغيرات إستخدام مجموعة متنوعة ‏ | 
| تمثيلات المتغير | من النماذج الإحصانية والتعلم Lon‏ 








شكل 0-6: عملية 5511114 للتنقيب في البيانات 

وعادةً ما يَستخدم بعض الممارسين مصطلح اكتشاف المعرفة في قواعد (KDD) OLLI‏ 
كمرادف للتنقيب في البيانات. وقد عرّف 118(7:20 وآخرون (1197) اكتشاف المعرفة في قواعد 
البيانات بأنها عمليةٌ لاستخدام أساليب التنقيب في البيانات؛ للعثور على معلومات وأنماط مفيدة 
في البيانات» على عكسٍ تعدين البيانات» والتي تنطوي على استخدام الخوارزميات لتحديد الأماط 
في البيانات المشتقة؛ من خلال عملية Jil) KDD‏ : الشكل 1-6). حيث à]‏ 1227 هي عمليةٌ 
شاملةٌ تشمل التنقيب في البيانات» ويتكون الإدخال إلى عملية 118 من بيانات تنظيمية: كما 
يتيج مستودع بيانات للمؤسسة تنفيذ KDD‏ بكفاءة؛ لأنه يوفر مصدرًا واحدًا للبيانات التي يتم 
استخراجها. وقد لخَّص )2003( lyf de KDD ålas Dunham‏ تتكوّن من الخطوات التالية: 
اختيار البيانات» معالجة البيانات» تحويل البيانات: التنقيب في البيانات» التفسير/ التقييم. 


عم ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التنبؤية :)١(‏ عمليةء وطرق» وخوارزميات التنقيب في البيانات 


الإقتباس 
المعرفة ' >= 
“رؤية قايلة ! 
للتحقيق * | 
الإستجابة 











شكل ع-1: عملية 117 (اكتشاف المعرفة في قواعد البيانات) 


ويوضُْح الشكل 6-/ نتائج الاستطلاع للسؤالء «ما هي المنهجية الرئيسة التي تستخدمها في 
التنقيب في البيانات؟» (تم à kdnuggets.com (à; Jb. 5e gXlazaNl‏ أغسطس ۲۰۰۷). 


CRISP-DM 


منهجية خاصة بمجال محدد 
لاشىء 
منهجية أخري 
(لا تخص مجال محدد) 
O 7‏ 50 40 30 20 10 0 


Source: Used With Permission From Kdnuggets.com 


شكل :۷-٤‏ رتب منهجيات/ عمليات التنقيب في البيانات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Fo‏ 














الفصل الرابع 


أسئلة للمراجعة على قسم it-t‏ 

-١‏ ما هي عمليات التنقيب في البيانات الرئيسة؟ 

-Y‏ اذا تعتقدٌ أنَّ المراحل الأولى (فهم العمل وفهم البيانات) هي الأطول في مشاريع التنقيب في البيانات؟ 

.CRISP-DM às Jolja „Sòl -Y‏ وعرّفها بإيجاز. 

-٤‏ ما هي الخطواث الرئيسة لمعالجة البيانات؟ قم ibs‏ كلّ خطوة بإيجازء مع تقديم أمثلة 
ذات صلة. 

ه- ما هو الفرق بين «CRI1SP-DM‏ SEMMAg؟‏ 


0-6 طرق التنقيب في البيانات: 

تتوفّر العديدٌ من الطرق المتنوعة لأداء دراسات التنقيب في البيانات» والتي تشمل: التصنيف» 
والانحدارء والتجميع؛ والترابط. وتّستخدم معظمٌ أدوات برامج التنقيب في البيانات أكثر من تقنية 
(خوارزمية) لكل من هذه الطرق. وفي هذا القسم نقدَّم وصقًا لأساليب التنقيب في البيانات الأكثر 
شيوعًا مع شرح التقنيات التي تقوم بتمثيلها. 
التصنيف: 

ربما تكون طريقة التصنيف للتنقيب في البيانات؛ هي الطريقة الأكثر استخدامًا لمشكلات 
العالم الحقيقي. وبصفتها عضوًا مشهورًا في عائلة تقنيات العام الآلي؛ فإنَّ التصنيف يتعلم DLÍ‏ 
من البيانات السابقة (مجموعة من ال معلومات - السّمات والمتغيّرات والميزات - على العناصر أو 
الكائنات أو الأحداث المسماة سابقًا) لوضع حالات جديدة (مع بطاقات تعريف غير معروفة) في 
مجموعاتهم أو فصولهم. فعلى سبيل المثال: تمْكن استخدام التصنيف للتنبؤ بما إذا كان الطقس 
في يوم معين سيكون «مشمسّا» أو «ممطرًا» أو «غائمًا»» وتتضمَّن مهام التصنيف الشائعة ا موافقة 
على الائتمان (أيّ: ا مخاطر الائتمانية الجيدة أو السيئة)» وموقع المتجر (أيْ: هل الموقع جيد. أو 
معتدلء أو سين؟). والتسويق المُستهدّف (على سبيل ال مثال: العميل aiot‏ أو الذي لا أمل 
منه)ء وكشف الاحتيال (أيْ: نعم/ لا)» والاتصالات السّلكية واللاسلكية (بمعنى أنه من المحتمل أن 
يتحوّل إلى شركة هاتف أخرىء نعم/ لا). فإذا كان المتوقع هو تسمية فئة (مثل: «مشمس» أو 
«ممطر» أو «غائم»)؛ فإن مشكلة التنبؤ تُسمّى تصنيفاً؛ في حين إذا كانت قيمة رقمية (على سبيل 
المثال: درجة الحرارةء مثل: 8 درجة 8)؛ فإن مشكلة التنبق تُسمَّى انحداراً 


rm‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): عملية» وطرقء وخوارزميات التنقيب في البيانات 


وعلى الرّغم من أنه يكن استخدامٌ التجميع (وهي طريقةً أخرى شائعةً للتنقيب في البيانات)؛ 
لتحديد المجموعات (أو عضوية الضَّف) للأشياء؛ فهناك فرق كبيرٌ بين الاثنين؛ إذ يتعرّف التصنيف على 
الوظيفة بين خصائص الأشياء (أيْ: المتغيّرات المستقلة) وعضويتها (أيّ: متغيّر المخرجات) من خلال عملية 
elsi‏ تحت الإشراف؛ en 3l‏ تقديمٌ كلا النوعين (المدخلات (ole ills‏ من المتغيرات إلى خوارزمية؛ أمّا 
في التجميع؛ فإن تعلّم عضوية الكائنات يتم من خلال عملية تعلّم غير خاضعة للإشراف؟ إذ يتم vj‏ 
مُتغيّرات الإدخال فقط على الخوارزمية. وعلى عكس التصنيف؛ فإن التجميع ليس له آليةٌ إشرافيةٌ 
(أو مراقبة) تفرض عملية التعلّم وبدلًا من ذلك؛ فإن الخوارزميات الخاصة بالتجميع تستخدم واحدًا 
أو أكثر من الاستدلالات (مثل: قياس المسافة مُتعدّد الأبعاد) لاكتشاف التجمعات الطبيعية للأجسام. 
وجديرٌ بالأكر أن منهجية الخطوتين الأكثر شيوعًا للتنبؤ بنوع التصنيف تتضمّن تطويرا/ 
Ls‏ نموذجياً واختباراً / fes‏ نموذجياً. وفي مرحلة تطوير gà‏ 2 یتم استخدامٌ مجموعة من 
بيانات الإدخالء بما في ذلك ملصقات الفئات الفعلية. وقد أن يتم تدريبٌ النموذج, ب يتم Aes‏ 
النموذج مقابل عينة الحجز لتقييم الدقةء وف النهاية en‏ نشره للاستخدام الفعلي؟ إذ e»‏ م التنبؤ 
بفئات مثيلات البيانات الجديدة (إذ يكون تصنيف الفئة غير معروف). وعند تقييم النموذج؛ 
5l‏ هناك عدة عوامل لا بد من أخذها في الاعتبارء وتتضمّن الآت: 
- الدّقة التنبؤية: هي قدرة النموذج على التنبؤ بشكل صحيح بتصنيف الفئة للبيانات الجديدة أو 
غير المرئية مسبقاً. ودقة التنبؤ هي عامل التقييم الأكثر استخدامًا لنماذج التصنيف. ولحساب 
هذا المقياس؛ فإنه يتح مطابقة تصنيفات الطبقة الفعلية لمجموعة بيانات اختبار مع تصنيفات 
الفئات التي يتنبأ بها النموذج. وبعد ذلك يكن احتسابٌ الدقة كمعدل دقة: وهي النسبة 
المئوية لعيّنات مجموعة بيانات الاختبار التي تمّ تصنيفها بشكلٍ صحيح بواسطة النموذج 
(وسوف نتناول هذا الموضوع بشيءٍ من التفصيل لاحقًا في الفصل). 

- السرعة: هي التكاليف الحسابية التي ينطوي عليها توليدٌ واستخدام النموذج وكلما كان ذلك 
أسرع؛ iz alè‏ أفضل. 

- المتانة: هي قدرة النموذج على إجراء تنبؤات دقيقة إلى حَذَّ معقول عندما يتم إعطاؤه بيانات 
صاخبة (غير دقيقة)» أو بيانات ذات قيم مفقودة أو خطأ. 

- قابلية التوسّع: هي القدرة على بناء نموذج التنبق بكفاءة تُعطى كميةً كبيرةً من البيانات. 

- التفسير: هو مستوى الفهم والبصيرة اللذان يوفرهما النموذج (مثل: كيف أو ما يختتمه 
النموذج في بعض التنبؤات). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yw‏ 


الفصل الرابع 


تقدير الدّقة الحقيقية لنماذج التصنيف: 

يُعَذَّ المصدرٌ الأماسي لتقدير الدّقة في مشكلات التصنيف؛ هو مصفوفة الدّقة (وتُسمّى أيضًا 
مصفوفة التصنيف أو جدول الطوارئ). ويُوضّح الشكل 6-6 مصفوفة الدقة لمشكلة تصنيف من 
فئتين؛ إذ تمثل الأرقام على طول القطر من اليسار العلوي إلى اليمين السفاي القرارات الصحيحة. 
والأرقام خارج هذا القطر تمثل الأخطاء. 





شكل 6-6: مصفوفة 002605102 بسيطة لجدولة نتائج تصنيف فئتين 
ويقدّم الجدول ١-6‏ معادلات مقاييس الدقة الشائعة لنماذج التصنيف. 
جدول 1-6: مقاييس الدّقة الشائعة لنماذج التصنيف 
القياس الوصف 
(TP+TN/TP) + (TN+FPFN) = 4b‏ ا nn‏ بشكل صحيح (إيجابيات 
وسلبيات) مقسومةً على إجمالي عدد الحالات. 
d. 3 (a-ka. Sensitivity)‏ الإيجابيات المصئّفة بشكل 
معدل موجب حقيقي - TP/ (TP«EN)‏ | صحيح مقسومةً على إجمالي العدد الموجب (أيْ: (iis‏ 
الضرب أو الاسترجاع) 
(19ك“638م5 .3.1.3) نسبة السلبيات المصئّفة بشكل 
معدل سالب حقيقي = TN/ (TN+FP)‏ | صحيح مقسومة على العدد الإجمالي السلبي (أيْ: diss‏ 
الإنذار الخطأ) 











Y‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 

















التحليلات التنبؤية :)١(‏ عمليةء وطرق» وخوارزميات التنقيب في البيانات 


القياس الوصف 
نسبة الإيجابيات المصئّفة بشكلٍ صحيح مقسومةً على 
(TP/TP)+FP = ey]‏ مجموع الإيجابيات المصئّفة بشكلٍ صحيح والإيجابيات 


نسبة الإيجابيات المصئّفة بشكلٍ صحيح مقسومةٌ على 
الاستدعاء = (TP/TP)+FN‏ مجموع الإيجابيات المصنّفة بشكل صحيح والسّلبيات 











وعندما لا تكون مشكلة التصنيف ثنائيةً؛ تزداد مصفوفة الارتباك (مصفوفة مربعة بحجم العدد 
الفريد لعناوين الفئات)» وتُصبح مقاييس الدّقة مُحدَّدة بمعدلات دقة الفئة ودقة التصنيف الإجمالية. 


(True Classification) 
(True Classification Rate); — 


ر 
a (False Classification)‏ 


i=1 
a (True Classification); 
لكاو‎ 0 a 


(Overall Classifier Accuracy); — 
Total Number of Cases 


X sj‏ تقديرٌ دقة نموذج تصنيف (أو مصنّف) الناجم عن تعلّم الخوارزمية تحت الإشراف 
أمرًا مهما لسببين: أولا: يمكن استخدامه لتقدير مدى دقة التنبؤ المستقبلية» والتي قد تشير إلى 
مستوى الثقة الذي يجبٌ أن يكون لدى المرء في مخرجات المصنف في نظام التنبؤ. وثانيًا: يمكن 
استخدامه لاختيار مصنف من بين مجموعة مصئّفات (تحديد نموذج التصنيف «الأفضل» بين 
مجموعة مُدرَّبة).و فيما يلي بعض منهجيات التقدير الأكثر شيوعًا الممستخدمة لنماذج التنقيب في 
البيانات بطريقة التصنيف. 

الانقسام البسيط: AË‏ الانقسام البسيط (أو إجراء تقييم أو اختبار للعيّنة) البيانات إلى 
مجموعتين فرعيتين حصريتين متبادلتين وتُعرفان بمجموعة التدريب ومجموعة الاختبار (أو 
مجموعة التمرير)» ومن الشائع تعبينُ ثلثي البيانات كمجموعة تدريب من قبل المحفّز (مُنشئ 
النموذج)» ومن ثم يتم اختبار المصنّف اللُدمَجٍ على مجموعة الاختبار. ويحدث استثناءٌ لهذه 
القاعدة عندما يكون المصنف عبارة عن شبكة عصبية اصطناعية. وفي هذه الحالة؛ يتم تقسيم 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري y‏ 




















الفصل الرابع 


البيانات إلى ثلاث مجموعات فرعية استثنائية: التدريب» والتحقق من الصحةء والاختبار. كما 
يتم استخدام مجموعة التحقق من الصحة في أثناء بناء النموذج لمنع التثبيت. ويوضّح الشكل 
٩-٤‏ منهجية الانقسام البسيط. 


تطوير النموذج 1 j‏ 


لا ر 
مصنف 
مدرب Y n‏ بيانات تمت 
qum |‏ | معالجتها مسبقا 


تقييم النموذج د 3 Y‏ 
(بالنقاط) | 38 | 











شکل :٩-٤‏ تقسيم البيانات العشوائية البسيطة 

ويتمثل النقدٌ الأساسي لهذه الطريقة في افتراض أن البيانات في المجموعتين الفرعيتين هي من 
نفس النوع (أيْ: لها نفس الخصائص بالضبط). ونظرًا لأن هذا التقسيم عشوائي بسيط؛ فقد لا 
يكون هذا الافتراض صحيحًا. ولتحسين هذا الوَضْع؛ فإنه يتم اقتراح أخذ العيّنات الطبقية؛ إذ 
تصبح الطبقات هي متغيرٌ المخرجاتء وعلى الرغم من أنَّ هذا يُعَنُ تحسّنًا على الانقسام البسيط 
غير أنه لا يزال لديه تحيّز مرتبط بالتجزئة العشوائية المفردة. 

التحقق باستخدام س - أجزاء (1-004): وتُستَخدَّم هذه المنهجية لتقليل التحيّز المرتبط 
بالمعاينة العشوائية لعيّنات بيانات التدريب والعزل في مقارنة الدقة التنبؤية لطريقتين أو أكثر. 
وفي هذه المنهجية» والتي يُطلق عليها أيضًا تقدير الدوران» يتح تقسيم مجموعة البيانات الكاملة 
بشكلٍ عشواني إلى مجموعات فرعية حصرية متبادلة متساوية الحجم تقريبًا؛ إذ يتم تدريب 
نموذج التصنيف واختباره عدد (س) من المرات. JS d‏ مرة يتم تدريبه على جميع أجزائه؛ ولكن 
مرة واحدة ثم يتم اختبارها على الجزء المنفرد المتبقي. awg‏ حساب تقدير هذه ا منهجية من 
الدقة الكلية للنموذج ببساطة بمتوسط مقاييس الدقة الفردية» كما هو مُوضّح في المعادلة التالية: 








Yve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التنبؤية :)١(‏ عملية. وطرق» وخوارزميات التنقيب في البيانات 


إذ يشيرُ 0174 إلى دقة التحقق ال متقاطع» و(س) هو عدد الأجزاء المستخدمةء و(4) هو Shis‏ 
الدّقة (أيْ: ds‏ الضربء والحساسية: والخصوصية) لكلّ جزء. يعرض الشكل ٠١-6‏ رسمًا بيانيًا 
للتصديق المتقاطع 1-1014 إذ تمّ تعيين س على .٠١‏ 











شكل :٠١-6‏ تصوير بياني لاختبار الصلاحية المتقاطع من عدد >1 من الطبقات 


منهجيات إضافية لتقييم التصنيف وتتضمّن منهجيات التقييم الشائعة الأخرى ما يلي: 

- الإبقاء على واحد 1,6896-0126-0116: وهذه الطريقة تشبه التحقّق المتقاطع من 1014-]1؛ إذ 
تأخذ >1 قيمة ١؛‏ بمعنى أنه ez‏ استخدام كلّ نقطة بيانات للاختبار مرة واحدة على العديد من 
النماذج المتقدّمة؛ إذ يُوجَد عددُ من نقاط البيانات. وهذه الطريقة مُستهلكة للوقت؛ غير أنها 
في بعض الأحيان تُعَذٌ خيارًا قابلًا للتطبيق بالنسبة لمجموعات البيانات الصغيرة. 

:Bootstrapping -‏ ومع هذه الطريقة یتم أخذ عينات عدد ثابت من النماذج من البيانات 
الأصلية (مع الاستبدال) للتدريبء وتُسِتَخدّم بقية مجموعة البيانات للاختبار. ويتمٌ تكرارٌ هذه 
العملية عدة مرات حسب الرغبة. 

- 8ق نسعلءك12: وعلى الرغم من تشابه هذه الطريقة مع منهجية 1:687:6-026-0114: مع احتساب 
التحصيل؛ فإنه يتخ حساب الدقة من خلال ترك عينة واحدة عند كل تكرار لعملية التقدير. 

- المنطقة تحت منحنى 806©0: إن المنطقة تحت منحنى :2.1800 هي تقنية تقييم رسومية؛ إذ 
يتم تخطيط المعدّل الإيجابي الحقيقي على المحور لا: ويتم رَسْم المعدل الإيجابي الخاص على 
المحور ×. وتحدد المنطقة الواقعة تحت منحنى ROC‏ مقياس دقة المصنف؛ إذ تشيرٌ القيمة 
١‏ إلى المصنف المثالي» في حين أنَّ ٠,0‏ لا تشير إلى أكثر من المصادفة العشوائية؛ وفي الواقع؛ فإن 
القيم تتراوح بين الحالتين المتطرفتين. فمثلًا في الشكل M V-€‏ يحتوي .4 على أداء تصنيف أفضل 
من 8 في حين أن © لا يكون أفضل من الفرصة العشوائية كرمي العملة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yvi‏ 








الفصل الرابع 


9 
o 


9 
in 


المعدل الإيجابي الحقيقي (الحساسية) 
o‏ 








T T T T T T T T 
0 01 02 03 04 05 06 07 08 09 1 


الح اح 


0 T 








شكل :1١-6‏ منحنى عينة ROC‏ 
تقنيات التصنيف تستخدم عدداً من التقنيات (أو الخوارزميات)؛ لنمذجة التصنيف» ومنها: 

- تحليل شجرة القرار: يمكن القول بأن تحليل شجرة القرار (تقنية تعلّم الآلة) هو أكثر تقنيات 
التصنيف شيوعًا في مجال التنقيب في البيانات. وسيرد Abs‏ مُفضصَّلٌ لهذه التقنية في القسم 
التالي من هذا الفصل. 

- تحليل إحصائي: كانت التقنيات الإحصائية عبارة عن الخوارزميات التصنيفية الأساسية؛ Bs‏ 
سنوات؛ حتى ظهرت تقنيات تعلّم الآلة. وتتضَّمّن تقنيات التصنيف الإحصاي الانحدار 
اللوجيستي والتحليل المميِّزْء وكلاهما من الافتراضات التي تفيد بأن العلاقات بين المتغيرات 
المدخلة وامخرجات تكون بطبيعتها خطيةء والبيانات مورّعة بشكل طبيعيء والمتغيرات ليست 
aola‏ وهس عقلة بعضهنا عن يعض. وَقد الث eda) sb dos LE dm‏ الافتراضَات إن 
التحوّل نحو تقنيات تعلّم الآلة: 

- الشبكات العصبية: وهذه التقنية هي الأكثر شيوعًا من بين تقنيات تعلّم الآلة» والتي يمكن 
استخدامها لمشكلات نموذج التصنيف. 


yvy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التنبؤية (1): عملية» وطرقء وخوارزميات التنقيب في البيانات 


- الاستدلال المبني على OYL gaill lio paiia l>‏ تاريخيةً؛ للتعرّف على القواسم المشتركة 
لتعيين حالة جديدة في الفئة الأكثر احتمالًا. 

- المُصنّفات gall lis austus :Bayesian classifiers & JI‏ نظرية الاحتمال لبناء نماذج تصنيف 
تستندٌ إلى الأحداث السابقة القادرة على وَضْع مثيلٍ جديد في فئة (أو سلسلة) أكثر احتمالا. 

- الخوارزميات الجينية: ويُقصّد بها استخدامٌ تشابه التطور الطبيعي لبناء آليات مستندة إلى 
البحث لتصنيف عيّنات البيانات. 

- المجموعات الخام: هذه الطريقة تأخذ بعين الاعتبار العضوية الجزئية لعلامات الفئات لفئات 
مُحدّدة مُسْبِقًا في نماذج البناء (تجميع القواعد) لمشكلات التصنيف. 

والحقيقة أنَّ الوصف الكامل لجميع تقنيات التصنيف خارج نطاق هذا الكتاب؛ وبالتالي فإننا 
سوف نتناول هنا العديد من التقنيات الأكثر انتشارًا فقط. 


مجموعة نماذج لأفضل التحليلات التنبؤية: 

إِنَّ عملية إنشاء مجموعات هي في جوهرها عمليةٌ ذكية لجمع المعلومات (التوقعات أو 
التنبؤات) التي تمّ إنشاؤها وتوفيرها من قبل اثنين أو أكثر من مصادر المعلومات (أيْ: نماذج التنبؤ). 
dies‏ الرغم من وجود جدلٍ مستمرٍ حول مستوى Sls‏ أساليب المجموعة الممستخدمة؛ فإن 
هناك إجماعاً عامًًا على أن نماذج المجموعات تُنتج معلوماتٍ أكثر قود وموثوقية لقرارات العمل 
(Seni & Elder, 2010)‏ أي إِنَّ الجمع بين التنبؤات تمكن أن (وغالبًا ما) يؤدي إلى تحسين الدقة 
وقوة نتائج المعلومات» مع الحَدٌ من الشك والتحيّز المرتبطين بالنماذج الفردية. 

وكما نعلم جميعًا أنه لا يوجد في نماذج التنقيب في البيانات والتنبؤ بها نموذجٌ JUS‏ عنه أنه 
«أفضل نموذج» مقبول عاليًا يناسب أيّ مشكلة؛ إذ يعتمدٌ أفضل نموذج على السيناريو الذي 
يجري تحليله ومجموعة البيانات المستخدّمة؛ وهذا النموذج لا يكن الحصول عليه إلا من خلال 
التجربة والخطأ على نطاق واسع (وهذا لا يحدث إلا في حالة توافر الوقت والموارد). ومثلما 
لا يُوجَد نموذج واحد يمكن أن يُوصف بأنه الأفضل؛ فإنه لا يُوجَد أيضًا أفضل تنفيذ منفرد لأنواع 
النماذج المختلفة؛ فمثلًا أشجار القرار والشبكات العصبية وآلة المتجهات الداعمة لها أساليب 
بناء ومجموعات من العوامل المتغيّرة تحتاجُ إلى «تحسين» أفضل النتائج الممكنة. ويقوم علماء 
البيانات بتطوير طرق جديدة لتحسين دقة وكفاءة نماذج التنبؤات في الوقت الحالي. وتتمثل 
إحدى الطرق المؤكدة للقيام بذلك gad è‏ مخرجات نماذج التنبؤ في نتيجة مركبة واحدة» وهي 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري را 


الفصل الرابع 


مجموعة نموذجية. وَتُعَذُ الفرق التي تستخدم مجموعة نماذج (©1ادهوم8) - الفرق التي فازت 
بالعديد من منافسات التنقيب في البيانات والتنبؤ بالبيانات في السنوات الأخيرة - هي الفرق 
الفائزة (وللحصول على قائمة بمسابقات التحليلات والفرص التحليلية 424 Kaggle.org : ail‏ 

وتمْكن تصنيف نماذج المجموعات إلى متجانسة أو غير متجانسة (307 2 ,2014 +اوطاطاه). 
وكما يوحي الاسم؛ فإن مجموعات النماذج المتجانسة تجمع بين نتائج نموذجين أو أكثر من 
نفس النوع من النماذج» مثل أشجار القرار. وفي الواقع؛ فإن تطوير أغلب مجموعات النماذج 
المتجانسة يتم باستخدام مزيج من هياكل شجرة iio LÄ‏ فئتا التعبئة والتعزيز الفئتين 
الشائعتين من مجموعات شجرة القرار. ويُطلق على المثال المعترف به بشكل كبيرٍ والذي حقق 
نجاحًا كبيرًا في مجموعات شجرة القرار من نوع مجموعات الغابة العشوائية Random Forest‏ 
- بدلا من بناء شجرة كبيرة؛ إذ تتطوّر الغابة العشوائية و70 12310012 كغابة من العديد من 
الأشجار الصغيرة. وخير مثال لدعم مجموعات شجرة القرار هو AdaBoosting‏ )555 اسم قصير 
ل «التعزيز التكيّفي») - وهو الخوارزمية التي تعمل على تغيير الوزن (أيْ: الأهمية أو المساهمة) 
المخصص لكل عينة بيانات في كل تكرار في عملية التعلّم, والذي يستند إلى نتائج التصنيف غير 
الصحيح؛ بحيث يتم تحسينٌ دقة المصنف / المتنبئ لجميع تصنيفات الفصل. 

Cle saa. Ul‏ النماذج غير المتجانسة؛ فإنها - كما يوحي اسمها - تجمع بين نوعين مختلفين أو 
أكثر من النماذج» مثل: أشجار القرارء والشبكات العصبية الاصطناعية: والانحدار اللوجستيء وآلة 
المتجهات الداعمة. والجدير بالذكر أن استخدام النماذج التي تختلف جوهريًا بعضها عن بعض 
isi‏ أحد عوامل النجاح الرئيسة في نمذجة المجموعات؛ إذ تتناول البيانات من منظور مختلف. 
ونظرًا لأن الطريقة التي تجمع بين نتائج نماذج مختلفة لأنواع مختلفة من النماذج؛ فإن ا مجموعة 
النموذجية غير المتجانسة LÀ u$‏ أيضًا نماذج الدّمج المعلوماق (Sharda, 20103 Delen)‏ $3 
عملية دَمْج نتائج نماذج متعددة. سواء أكانت تصويتاً بسيطاً (كلّ نموذج يُسهم بالقدر «Lal‏ 
صوت واحد) أو مزيج تركيبي من التصويت (يُسهم كل نموذج بناءً على دقة التنبؤ به - النماذج 
الأكثر دقةً لها قيمة وزن أعلى) ممكن اس تخدامه. وبغض النظر عن طريقة التوليفة؛ فقد ثبت 
أن ا مجموعات تمثل إضافة لا تُقدّر بثمن لأيّ مشروع للتنقيب في البيانات والنمذجة التنبؤية. 
وعلى الرغم من أنَّ النمذجة المُعرَّزة تعمل على تحسين الدقة والقوة: غير أن لها جانباً سلبيًّ؛ إذ 
إنها تزيدُ أيضًا من تعقيد النموذج» ومن ثم عدم القدرة على تفسيرها (أيْ: الشفافية). ويُوضّح 
الشكل 1١-6‏ رسمًا بيانيًا لمجموعة نموذج غير متجانس. 


yve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عملية» وطرق» وخوارزميات التنقيب في البيانات 

















شكل 6-؟1١:‏ توضيح بياني لمجموعة غير متجانسة 

وقبل أن نوضّح تفاصيل أشجار القرار؛ فإننا نحتاج إلى مناقشة بعض المصطلحات البسيطة. 
أولا: تشمل أشجار القرار العديد من متغيرات المدخلات التي قد يكون لها تأثيرٌ على تصنيف 
الأنماط المختلفة. وعادةً ما تُسمّى هذه المتغيرات المُدخَلة بالسّمات. فمثلًا إذا أردنا بناء نموذج 
لتضنيف مخاطر القروض على أساس اثنين فقط من الخصائص - الدخل والتصنيف الاثتماني - فإن 
هاتين الخاصيتين ستكونان هما الصفات» وا مخرجات الناتجة ستكون هي الفئة (والتي قد تكون 
منخفضة أو متوسطة أو عالية المخاطر). ثانياً: تتكون الشجرة من مجموعة من الفروع والعقد. 
ويمثل الفرع نتيجة اختبار لتصنيف نمط (على أساس اختبار) باستخدام إحدى السّمات. وتمثل 
عقدة الورقة في النهاية اختيار الفصل النهائي للنمط (سلسلة من الفروع من عقدة الجذر إلى 
عقدة الورقةء والتي هكن تمثيلها كإشارة #1٠١‏ معقدة). 

وتكمن الفكرة الأساسية وراء شجرة القرار في أنها تقسّم بشكل متكرّر مجموعة sapi d‏ 
حتى يتكون US‏ قسم Jal Ja‏ أو بشكلٍ أساسي من أمثلة من فصل واحد. وتحتوي كلّ عقدة 
غير ورقية من الشجرة على نقطة انقسام وهي عبارة عن اختبار لواحد أو Qo SÍ‏ السمات 
izis‏ كيفية تقسيم البيانات بشكلٍ asi‏ وبشكلٍ fele‏ فإن الخوارزميات الخاصة بشجرة القرار 

تقوم بإنشاء شجرة مبدئية من بيانات التدريب؛ بحيث تكون js‏ عقدة عبارة عن أوراق eds‏ 
تقوم بتقليم الشجرة لزيادة تعميمهاء وبالتالي دقة التنبؤ على بيانات الاختبار. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yvo‏ 











الفصل الرابع 


وفي مرحلة النمؤ؛ يتم بناء الشجرة عن طريق تقسيم البيانات بشكلٍ مُتكرّر حتى تصبح كل 
وحدة نقية (أيْ: تحتوي على أعضاء من نفس الفئة) أو صغيرة نسبيًا. وفكرتها الأساسية تعتمد 
على طرح الأسئلة والتي تقوم الإجابات عنها بتوفير معظم المعلومات, على غرار ما قد نفعله إذا 
لعبنا لعبة «عشرون «ss‏ 

ويعتمد الانقسامٌ المستخدّم لتقسيم البيانات على نوع السّمة المُستخدمة في التقسيم. وبالنسبة 
إلى السّمة المستمرة A‏ تكون التقسيمات من قيمة النموذج × > (4)؛ إذ تمثل × قيمة الانقسام 
«ا مثلى» ل 4. فعلى سبيل ال مثال يكن أن يكون التقسيم ال مبني على الدخل هو «الدخل 0٠٠٠١‏ >». 
وبالنسبة distal à‏ ۸؛ فإن الانقسامات التي هي من قيمة النموذج (4) تنتمي X Car X dH‏ 
هي مجموعة فرعية من 4. فمثلًا هكن أن يكون الانقسام على أساس الجنس: «ذكر مقابل أنثى». 

أمّا الخوارزمية العامة لبناء شجرة القرار؛ فهي كما يلي: 
-١‏ إنشاء عقدة جذرية وتعيين جميع بيانات التدريب إليها. 
؟- تحديد أفضل سمة تجزئة. 
-Y‏ إضافة فرع إلى عقدة الجذر لكلّ قيمة من الانقسام؛ بحيث ez‏ تقسيم البيانات إلى مجموعات 

فرعية متبادلة (1118مم110207:6112) على طول خطوط التقسيم sol‏ والانتقال إلى الفروع. 
4- تكرير الخطوتين ؟ و8 لكلّ عقدة موجودة في كلّ ورقة حتى الوصول إلى معايير التوقف (فمثلا 

يتم التحكم في العقدة بتسمية فئة واحدة). 

وقد تم اقتراحٌ العديد من الخوارزميات المختلفة لإنشاء أشجار القرار. وتختلف هذه 
الخوارزميات بشكل أساسي من حيث الطريقة التي تُحدّد بها خاصية التجزئة (وقيمها 
اللقسومة)» وفرقنب تقسيح :السؤات[تقسيع :فقس السمة.مرة واجدة فقط أوعدة مراث]: وعدد 
الانقسامات عند كلّ عقدة (ثنائي مقابل ثلاثي)» ومعايير التوقف» وتقليم الشجرة (ما قبل الحرق 
.(postpruning‏ ومن أكثر الخوارزميات شهرةًَ نظام 1103 (متبوعة ب 04.5 و05 كنسخ معدلة 
من 123) من تعلم الآلة» والتصنيفء بالإضافة إلى أشجار الانحدار (08185) من الإحصائيات: 
وكاشف التفاعل الأوتوماتيكي مربع كاي s chi-squared (CHAID)‏ التعرّف على الأماط. 

وعند إنشاء شجرة قرار؛ يكون الهدف في كل عقدة هو تحديدٌ السّمة ونقطة الانقسام لهذه 
السمة التي تقسّم سجلات التدريب على أفضل وجه لتنقية تمثيل الفئة في تلك العقدة. ولتقييم 
سلامة الانقسام؛ فقد تمّ اقتراحٌ بعض مؤشرات التقسيم. وقد وُحِدَ أن أكثر مؤشرين شيوعًا هما 


yvi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عمليةء وطرق» وخوارزميات التنقيب في البيانات 


مؤشر جيني 111046© وكسب امعلومات 82111 111101108]101؛ حيث يُستَخدَّم مؤشر جيني 
1506 فصذك في خوارزميات :041:15 و50812/1 (قابلة للتحجيم بالتعقب الذاتي للأشجار). كما 
يتم استخدام إصدارات من كسب المعلومات في 103 (والإصدارات الأحدث, 04.5 و05). 


وقد استخدم مؤشر جيني 1006 1م61 في الاقتصاد لقياس تنوع السكان. كما يمكن استخدام 
نفس المفهوم لتحديد درجة نقاء فئة معينة كنتيجة لقرار التفرّع على طول سمة أو متغير معين. 
وأفضل انقسام هو الذي يزيد من نقاء المجموعات الناتجة عن الانقسام المقترح. وفيما يلي 
نتناول بإيجاز حساباً بسيطاً لمؤشر جيني. 

إذا كانت مجموعة البيانات 5 تحتوي على أمثلة من فثات ١؛‏ فسيتم تعريف مؤشر جيني 
Gini index‏ على أنه 


gini(S) = 1- ap? 
j=1 


حيث ز۶ هو تردد نسبي للفئة زفي 8. فإذا كانت مجموعة البيانات 5 مقسمةً إلى مجموعتين 
فرعيتين» 51 و252 بأحجام 1 و2 على التوالي؛ فإنْ مؤشر جيني 0111206 للبيانات المقسّمة 

يحتوي على أمثلة n Dbd go‏ ويتم تعريف مؤشر جيني de Gini index‏ أنه 
N; T N»‏ 


iniga(S)  — . .... a 
e v gin(S) ^. giniS;) 


حيث يتم اختيار مجموعة السمة / الانقسام التي توفر أصغر (8) sginisplit‏ من أجل تقسيم 
العقدة. وفي مثل هذا الشأن؛ فإنه يجب سرد جميع نقاط التقسيم الممكنة لكلّ صفة. 

أمّا كَسْب المعلومات؛ فهو آلية التقسيم الممُستَخدّمة في 1103 والتي ربما تكون الخوارزمية 
الأكثر شهرةً والمعروفة باسم شجرة القرار. وقد تمّ تطويرها من قبل صهلصنن© 1055 في 1947م: 
ومنذ ذلك الحين؛ فقد قام بتطوير هذه الخوارزمية ضمن الخوارزميات 04.5© و5©. وتكمن 
الفكرة الأساسية ل 123 (ومتغيراتها) في استخدام مفهوم يمى الإنتروبيا رم ٥٣٤٠ء‏ بدلا من 
tGini index zur f$‏ حيث يقيس الانتروبيا مقدار الشك أو العشوائية في مجموعة البيانات. 
فإذا كانت جميع البيانات في مجموعة فرعية تنتمي إلى فئة واحدة فقط؛ فلا يُوجَد أي شك أو 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yw‏ 


الفصل الرابع 


عشوائية في هذه المجموعة من البيانات» وبالتالي؛ فإن lis ga Saylla åo entropy lwoo‏ 
النهج؛ هو بناء الأشجار الفرعية بحيث تكون الإنتروبيا J5J entropy‏ شجرة فرعية نهائية صفر 
(أو قريبة من الصفر). وفيما يلي نتناول أيضًا حساب كسب المعلومات. 

وعلى افتراض أنَّ هناك فئتينء P‏ (موجبة) وه (سالبة). دع مجموعة الأمثلة 5 
تحتوي على عدد م من فئة 2 وعدد 2 من الفئة 21. فإن كمية المعلومات المطلوبة 
لتحديد ما إذا كان المثال التعشّفي في 5 ينتمي إلى < أو N‏ يتم تعريفها على أنها 

- : 

Kp,n) — - n wog, 
ptn ptm ptn دزو‎ 


— 

o 

m 
ua 








وبفرض استخدام السمة ل فإنه سيتم تقسيم المجموعة 5 إلى مجموعات [50 ,... ,52 ,51]. 
فإذا احتوى 51 على أمثلة ذم من entropy Lusy ob IN o ni 4 Els P‏ أو المعلومات 
المتوقعة اللازمة لتصنيف الكائنات في كل الأشجار الفرعيةء ا هي 





T ا‎ PE ] 
EIA) = AP * Tipi) | 

i=1P +n 
ومن َمُ؛ فإن المعلومات التي سيتم اكتسابها من خلال التفرّع على السّمة 4 ستكون‎ 
-Gain (A) = I (p.n) - E (A) 

حيث يتم تكرار هذه الحسابات لكلّ سمة:. كما يتم تحديدٌ تلك التي لها كسب ا معلومات 
العالي كسمة التجزئة. وتتشابه الأفكار الأساسية وراء مؤشرات التقسيم هذه بعضها مع بعض» 
غير أن تفاصيل الخوارزمية المُحدَّدة تختلف. ويمكن العثورٌ على تعريف تفصيلي لخوارزمية 123 
وآلية تقسيمها في (1986) صفلسنت©. 

وتوضْح الحالة العملية 0-6 مدى أهمية المكاسب المتحضّل عليها إذا تمّ استخدام تقنيات 
التنقيب في البيانات الصحيحة لمشكلة عمل مُحدَّدة بشكل جيد. 


YVA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات التنبؤية dias :)١(‏ وطرقء وخوارزميات التنقيب في البيانات 


حالة عملية ٥-٤‏ 
تستخدم شركة 11215 ©م1106م1 التحليلات التنبؤية المتقدّمة للتركيز على العوامل 
التي تؤثر حقا في قرارات الرّعاية الصحية الخاصة بالأشخاص 

Influence Health i Sà p455‏ منصة تفاعل وتفعيل المستهلك الرقمي الوحيد في 
قطاع Influence Health iai G$ čo iall ile I‏ مقدّمي الخدمة وأصحاب 
العمل والدافعين من التأثير إيجابًا على صُّنْع القرار والسلوكيات الصحية للمستهلك 
ما يتجاوز إعداد الرعاية البدنية من خلال المشاركة المتعددة الشخصية والتفاعلية. 
وقد ساعدت الشركة منذ عام 1937م - ومقرها في برمنغهام بولاية ألاباما - أكثر من ٠٠١١‏ 
منظمة مزوّدة في التأثير على المستهلكين بطريقة تحؤلية لتوفير التكاليف بالإضافة إلى الجودة. 

إن الرعاية الصحية هي عمل شخصي؛ إذ تختلف احتياجات كلّ مريض وتتطلب 
استجابة فرديةء ومن ناحية أخرى - فإنه مع استمرار ارتفاع تكاليف توفير خدمات 
الرعاية الصحية- تحتاج المستشفيات والنظم الصحية بشكل متزايد إلى الاستفادة من 
وفورات الحجم من خلال توفير الطعام لأكبر عدد من السكان؛ إذ يصبح التحَدَّي عندئذ 
هو توفير نهج شخصي في أثناء العمل على نطاق واسع. كما تتخصّص شركة 1541016566 
14 في مساعدة عملاء قطاع الرعاية الصحية على Jor‏ هذا التحَدّي من خلال 
التعرّف على مرضاهم الحاليين وا محتملين بشكل أفضل واستهداف كل فرد بالخدمات 
الصحية المناسبة في الوقت المناسب. وتسمح تقنية التحليلات التنبؤية المتقدّمة من 
BM‏ لشرکة Health‏ uenceاnf]‏ ساعدة عملاتها على اكتشاف العوامل التي لها أكبر 
تأثيرٍ على قرارات الرعاية الصحية للمرضى. ومن خلال تقييم ميل مثات الملايين من 
Aaa‏ المتوقعين للحصول على خدمات رعاية صحية خاصة؛ Influence Health j|‏ 
قادرةٌ على زيادة الإيرادات ومعدلات الاستجابة لحملات الرعاية الصحية. وتحسين 
النتائج لعملائها ومرضاهم على حَذَّ سواء. 

استهداف المستهلك الذكي: 

أصبحت صناعة الرعاية الصحية اليوم أكثر تنافسيةً من أيّ وقتِ مضى؛ إذ إِنَّ انخفاض 
استخدام خدمات المنظمة؛ يؤدي إلى انخفاض أرباحها أيضًا؛ إذ ميل المستهلكون الآن 
إلى اختيار أفضل مُقدَّمي الرعاية الصحية» بدلا من مجرد البحث عن أقرب مستش فى 
أو عيادة» وبالتوازي مع الجهود المشتركة في الصناعات الأخرى؛ فإنه يجب على منظمات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yya‏ 


الفصل الرابع 


الرعاية الصحية بذل ال مزيد من الجهد لتسويق نفس ها بشكلٍ فعّال لكلّ من المرضى 
الحاليين والمحتملين وبناء التواضل والولاء على المدى الطويل. 

إن مفاتيح النجاح في تسويق الرعاية الصحية؛ هي التوقيت المناسب والأهمية. 
فإذا كنت تستطيع التنبؤ بنوع الخدمات الصحية التي ق يحتاجها الفرد المحتمل؛ فإنه 
يمكنك المشاركة والتأثيرُ عليه بشكلٍ أكثر فاعليةً في العناية بالصحة. 

يُوضّح 48 Venky Rav‏ رئیس قسم التحلیلات ق Influence Health åS,‏ أن: 
«مؤسسات الرّعاية الصحية تخاطر بفقدان انتباه الأشخاص إذا أوصلوا إليهم رسائل 
غير ذات صلة. ونحن نساعد عملاءنا على تجنب هذا الخطر من خلال استخدام التحليلات 
لتقسيم آفاقهم الحالية وا محتملة والسوق لهم بطريقة شخصية وملائمة أكثر بكثير». 

تحليلات أسرع وأكثر مرونة: 

ومع توسّع قاعدة عملائها؛ ازداد الحجم الإجمالي للبيانات في أنظمة التحليلات في 
Influence Health‏ لیشمل أکٹثر من ۱۹١‏ ملیون سجل للمرضی» مع سجل تفصياي للمرض 
sd‏ 63 ملايين من المرضى. وقد علق 18331313 على ذلك بقوله: «مع وجود الكثير من 
البيانات للتحليل؛ أصبحت طريقة تسجيل البيانات الحالية لدينا معقدةً للغاية وتستغرق 
وقتاً طويلاً. ولذلك فقد أردنا أن نكون قادرين على استخراج الأفكار بسرعة أكبر ودقة أكبر». 

ومن خلال الاستفادة من برمجيات التحليلات التنبؤية IBM o‏ أصبحت 
5M! Influence Health‏ 3 5,3 على تطوير نماذج تحسب مدى احتمالية أن يحتاج 
كل مريض إلى خدمات معينة وتُعبّر عن هذا الاحتمال كنسبة مئوية. ويعتمد التقسيم 
الجزئي والعديد من النماذج الخاصة بالأمراض على البيانات الدهوغرافية والاجتماعية 
والاقتصادية والجغرافية والسلوكية وتاريخ الأمراض وبيانات التعداد وبحث الجوانب 
المختلفة لاحتياجات JS‏ مريض من الرعاية الصحية المتوقعة. 

IBM Å> L quos» S838 Ravirala (à Laus‏ الجمع بين كلّ هذه النماذج 
باستخدام تقنية المجموعة؛ مما ial de aclu‏ على قيود النماذج الفردية وتقديم 
نتائج أكثر دقةٌ؛ فهي تمنحنا المرونة لتطبيق تقنيات متعددة لحلّ مشكلة ما والتوصّل 
إلى أفضل o‏ كما أنها تعمل على تنفيذ الكثير من عمليات التحليلات تلقائيًا؛ 
مما مكنا من الاستجابة لطلبات العملاء بشكلٍ أسرع من ذي قبلء وكثيرا ما نوفر لهم 
مستوى أعمق من البصيرة فيما يتعلق بالقطاع المرضى». 


Y^.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عملية» وطرقء وخوارزميات التنقيب في البيانات 


فعلى سبيل المثال: قرّرت ]11621 101111656 اكتشاف كيفية انتشار المرض وتنوع 
الخطر بين مجموعات مختلفة داخل عامة السكان. وذلك باستخدام تقنيات تحليل مجموعة 
معقدة للغاية: تمكّن الفريق من اكتشاف أمراض الاعتلال ا مشتركة الجديدة التي تعمل على 
تحسين القدرة على التنبؤ بالمخاطر لأكثر من ٠٠١‏ مرض شائع بنسبة تصل إلى .//٠١‏ 

وهذا يساعد على التفريق بثقة تامة بين المرضى ذوي المخاطر العالية وا معرضين 
مخاطر عالية للغاية؛ مما يسهّل استهداف الحملات على المرضى والمحترفين الذين هم 
في أمسّ الحاجة إليها. ومع وجود مثل هذه الأفكار في متناول اليد؛ فإن 151106566 
jab Health‏ على استخدام خبرتها في تسويق الرعاية الصحية لتقديم المشورة لعملائها 
حول أفضل السُبل لتخضيص موارد التسؤيق. 

وقد أردف 118511818 قائلًا: «يقوم عملاؤنا بعمل ضوابط كبيرة للميزانية على أساس 
التوجيهات التي نقدمها لهم». «ونحن نساعدهم على زيادة تأثير حملات رة واحدة - 
مثل حملات سوق التأمين الصحي عند بدء 003132856 - بالإضافة إلى خططهم 
الإستراتيجية الطويلة المدى والاتصالات التسويقية المستمرة». 

الوصول إلى الجمهور المناسب: 

يساعد تأثيرٌ شركة de Influence Health‏ زيادة الإيرادات وتحسين الصحة 
السكانية؛ من خلال تمكين عملائها من استهداف أنشطتهم التسويقية بشكل أكثر 
فعاليةً. 2535 Ados» :Ravirala e‏ العمل معنا؛ تمگن العملاء من تحقيق عائد 
استثماري يصل إلى 1-17 من خلال التسويق المُستَهدّف بشكلٍ أفضلء لا يتعلق الأمر 
فقط بالإيرادات: فمن خلال ضمان إرسال معلومات الرعاية الصحية الحيوية إلى 
الأشخاص الذين يحتاجون إليهاء نحن نساعد عملاءنا على تحسين مستويات الصحة 
العامة في المجتمعات التي تخدمهم». 

وتستمرٌ 11611 مم1 في صقل تقنيات النمذجة. واكتساب فهم أعمق 
للسمات الحرجة التي تؤثر على قرارات الرعاية الصحية. فمع مجموعة أدوات تحليل 
مرنة في متناول يدها؛ فإن الشركة مجهزةٌ بشكل جيدٍ للحفاظ على تحسين خدماتها 
للعملاء. ويذكر 8201815 أنه: «في dais ad‏ يد أن نتعرف على بيانات المريض 
والبيانات المرتقبة إلى المستوى التاليء ونحدد أنماط السلوك وندمج التحليل مع مكتبات 
تعلم الآلة. لقد أعطتنا 18315855 بالفعل القدرة على تطبيق ودمج العديد من 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YN‏ 


الفصل الرابع 


الموديلات دون كتابة خط واحد من التعليمات البرمجية. ونحن حريصون على الاستفادة 
من حل 18۷ مع توسيع نطاق تحليلات الرّعاية الصحية لدينا لدعم النتائج السريرية 
وخدمات إدارة صحة السكان». 

ويختتم 18231812 Venky‏ رئيس قسم التحليلات في :lê Influence Health‏ 
«نحن نحقق تحليلات على نطاق غير مسبوق. فاليوم؛ يمكننا تحليل 110 مليون سجل 
مع 0 نموذج مختلف في أقل من يومين» وهي مهمةٌ لم تكن ممكنة لنا في الماضي». 

أسئلة للمناقشة: 

3Influence Health css l3Ls - Y 

۲- ما هي التحديات والحلول المقترحة والنتائج التي تمّ الحصول عليها؟ 

-Y‏ كيف يمكن أن يساعد التنقيب في البيانات الشركات في صناعة الرعاية الصحية 
(بطرق أخرى غير المذكورة في هذه الحالة)؟ 


Source: Influence Health: Focusing on the factors that really influence people's 


healthcare decisions. IBM Case Study, www.presidion.com/case-study-influence-health. 


التحليل التجميعي للتنقيب في البيانات: 

lal did‏ التجميعي طريقة أساسيةً للتنقيب ف البيانات لتصنيف العناصر أو الأحداث أو 
المفاهيم إلى مجموعات مشتركة تسمّى مجموعات. وتستخدم هذه الطريقة بشكلٍ شائع في علم 
الأحياء» والطب» وعلم الوراثةء وتحليل الشبكات الاجتماعية» وعلم الإنسان» وعلم الآثارء بالإضافة 
إلى علم الفلك» والتعرّف على المفاهيم؛ وحتى في نظم إدارة المعلومات (8115). ونظرًا لزيادة 
انتشار التنقيب في البيانات؛ فقد تمَّ تطبيق التقنيات الأساسية على الأعمال؛ خاصةً على التسويق. 
كما تم استخدامٌ التحليل التجميعي على نطاق واسع؛ للكشف عن الاحتيال (كلّ من الاحتيال على 
بطاقة الائتمان والتجارة الإلكترونية) وتجزئة السوق للعملاء في أنظمة 0180/1 المعاصرة. ويستمر 
تطوير المزيد من التطبيقات في الأعمال؛ إذ يتم التعرّف على قوة تحليل المجموعات واستخدامها. 

إن التحليل التجميعي هو أداةٌ لتحليل البيانات الاستكشافية لحل مشكلات التصنيف. ويهدف 
إلى تصنيف الحالات (مثل: الأشخاص. والأشياءء والأحداث) إلى مجموعات أو مجموعات؛ بحيث 
تكون درجة الارتباط قويةً بين أعضاء نفس المجموعة وضعيفةً بين أعضاء المجموعات المختلفة. 
وتصف كل مجموعة الفئة التي ينتمي إليها أعضاؤها. ومن الأمثلة الواضحة في تحليل الأبعاد 


YAY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية dalos :)١(‏ وطرق» وخوارزميات التنقيب في البيانات 


التجميعية؛ إنشاء نطاقات درجات تمكن من خلالها تعيين درجات دراسية لفئة الكلية. وهذا 
يشبه مشكلة التحليل التجميعي التي واجهتها وزارة الخزانة الأمريكية عند إنشاء أقواس ضريبية 
جديدة في الثمانينيات. مثال خيالي لحدوث التجميع في كتب هاري J. K. Rowlings 13s»‏ 
Sorting Hat 3à Harry Potter books‏ أي بيت (مبنى) لتعيين طلاب السنة الأولى à‏ 
مدرسة هوجورتس. مثالٌ آخر ينطوي على تحديد كيفية جلوس الضيوف في حفل الزفاف. أمَّا 
فيما يتعلق بمعالجة البيانات؛ فإن أهمية التحليل التجميعي هي أنها قد تكشف عن مجموعات 
وهياكل في بيانات لم تكن واضحةً من قبل ولكنها معقولة ومفيدة عندما يتم العثور عليها. 
ويمكن استخدامٌ نتائج التحليل التجميعية في: 
- تحديد نظام التصنيف (مثل: أنواع العملاء). 
- اقتراح نماذج إحصائية لوصف السكان. 
- ظهور قواعد لتعيين حالات جديدة للفصول لتحديدها واستهدافها وأغراض التشخيص. 
- توفير مقاييس التعريف والحجم والتغيير في المفاهيم السابقة. 
- البحث عن حالات نموذجية لتسمية وتمثيل الطبقات. 
- تقليل حجم وتعقيد مساحة المشكلة للطرق الأخرى للتنقيب في البيانات. 
- تحديد القيم المتطرفة في مجالٍ معين (مثل: اكتشاف الأحداث النادرة). 
تحديد العدد الأمثل للمجموعات: تتطلّبٍ الخوارزميات التجميعية عادةً تحديدٌ عدد المجموعات 
المطلوب العثور عليها. فإذا كان هذا الرقم غير معروف من خلال المعرفة السابقة؛ فإنه يجب 
اختياره بطريقة ما. ولسوء الحظ؛ فإنه لا تُوجَد طريقة اختيارية لحساب ما يفترض أن يكون هذا 
الرقم. ولذلك فقد تمَّ lj‏ عدة طرق إرشادية مختلفة. وفيما يلي نذكر أكثر هذه الطرق شيوعًا: 
- انظر إلى النسبة المئوية للفارق المموضّح كدالة لعدد المجموعات؛ أيْ: اختر عددًا من امجموعات؛ 
بحيث لا يؤدي إضافة مجموعة أخرى إلى إعطاء نماذج أفضل للبيانات. وعلى وجه التحديد 
إذا تمّ توضيحٌ السب المئوية للتباين في أحد الرسوم البيانية بواسطة المجموعات؛ فهناك 
نقطة سينخفض عندها الكسب الهامشي (إعطاء زاوية في الرسم البياني)؛ مما يشير إلى عدد 
ا مجموعات التي سيتم اختيارها. 
- اضبط عدة المجموعات >١ / ۲ (n/ Y) de‏ حيث ١‏ هو عدد نقاط البيانات. 
- استخدم معيار امعلومات ء)نه)4 »)41٥(‏ وهو مقياسٌ للصلاحية الملائمة (على أساس مفهوم 
الانتروبيا تإم62650) لتحديد عدد المجموعات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري FAY‏ 


الفصل الرابع 


- استخدم معيار المعلومات Bayesian‏ وهو معيار اختيار النموذج (على أساس الحَدَّ الأقصى 
لتقدير الاحتمال) لتحديد عدد المجموعات. 

طرق التحليل: قد يعتمد تحليل المجموعات على واحد أو أكثر من الطرق العامة التالية: 
- الأساليب الإحصائية Le)‏ في ذلك التسلسل الهرمي وغير الهرمي)» .k-modes sÎ k-means :Jżs‏ 
- الشبكات العصبية (مع أسلوب بناء يُسمّى خريطة التنظيم الذاقي). 
- امنطق الضبابي (مثل: خوارزمية (fuzzy ٥-٣۴۵8‏ 
- الخوارزميات الجينية. 

تعمل كل طريقة من هذه الطرق بشكلٍ عام مع واحدة من فنتي الطريقة العامة: 
- انقسام: مع الفصول المقسّمةء تبدأ جميع العناصر في مجموعة واحدة وتتفكك. 
- تجميع هرمي: مع الفئات التجمعية: تبدأ جميع العناصر في مجموعات فردية» وتكون 

المجموعات مجمعة معًا. 

وتتضمّن معظم طرق التحليل التجميعية استخدام مقياس المسافة؛ لحساب التقارب بين أزواج 
العناصر. وتشمل مقاييس المسافة المنتشرة المسافة التقليدية Gİ)‏ المسافة العادية بين نقطتين 
يمكن قياسها بالمسطرة) ومسافة مانهاتن (وتُسمّى أيضًا المسافة المستقيمة» أو مسافة التاكسي بين 
نقطتين). وفي كثير من الأحيان تقوم على مسافات حقيقية يتم قياسهاء ولكن هذا لا يلزم أن يكون 
UIS‏ كما هو الحال عادةً في تطوير نظم المعلومات. كما يمكن استخدامٌ المتوسطات المرجّحة 
لتحديد هذه المسافات. فمثلًا في مشروع تطوير 18 قد تكون الوحدات الفردية للنظام مرتبطة 
بالتشابه بين مدخلاتهاء والمخرجات. والعملياتء والبيانات المُحدَّدة المُستخدّمة. ثم يتم تجميع 
هذه العواملء متزاوجةً حسب العنصرء في مقياس مسافة واحدة. 

الخوارزمية التجميعية 536325-ك5: بمكن القول بأن K-means 445) lg‏ )$42 تشير ع1 إلى 
عدد مُحدَّد مسبقاً من المجموعات) هو أكثر الخوارزميات التجميعية التي يُشار إليها. كما أن لها 
جذورها في التحليل الإحصائي التقليدي. وكما يوحي الاسم؛ فإن هذه الخوارزمية تقوم بتعيين كل 
نقطة بيانات (العميل؛ الحدث, الكائن... إلخ) إلى المجموعة التي يكون مركزها (التي يُطلق عليها 
أيضًا النقطة الوسطى) هو الأقرب. ويتم حسابٌ المركز كمتوسط جميع النقاط في المجموعة؛ 
أي إِنَّ إحداثياتها هي المتوسط الحسابي لكل بُعد بشكلٍ منفصل على كل النقاط في ا مجموعة. 
ويوضّح الشكل 1-6 خطوات هذا الخوارزمية والتي سنذكرها فيما يلي: 


PAE‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية dias :)١(‏ وطرقء وخوارزميات التنقيب في البيانات 


- خطوة التهيئة: اختر عدد المجموعات (أيّ: قيمة >1). 

- الخطوة :١‏ إنشاء نقاط عشوائية >1 عشوائيًا كمراكز مجموعة أولية. 

- الخطوة ؟: قم بتعيين كل نقطة إلى مركز المجموعة الأقرب. 

- الخطوة :١‏ إعادة إنشاء مراكز المجموعات الجديدة. 

- خطوة التکرار: کرر الخطوتین ۲ و٠‏ حتى يتم استيفاء معيار تقارب (عادةً ما يصبح تعبين 





شكل ع-1: توضيح بياني للخطوات في خوارزمية K-Means‏ 


التنقيب في قاعدة الترابط: 

عد التنقيب في قاعدة الترابط (ابمعروف أيضًّا باسم تحليل التقارب أو تحليل سلة السوق) 
أسلوبًا شائعًا للتنقيب في البيانات؛ إذ يُستَخْدَّم عادةً كمثال لتوضيح ما الذي يعنيه التنقيب في 
البيانات: وما يمكن أن يفعله لجمهور أقل خبرة من الناحية التقنية. وقد يكون معظمكم قد سمع 
عن العلاقة الشهيرة (أو سوء السمعة؛ فهذا يعتمد على نظرتكم إليها) التي تفصل بين مبيعات البيرة 
والحفاضات في محلات البقالة. وكما تقول القصة؛ فإن سلسلة متاجر كبيرة sy Gs Walmart lgj)‏ 
حيث لا يُوجَّد توافق في الآراء بشأن سلسلة السوق الفائقة التي كانت عليها) قامت بتحليل عادات 
الشراء لدى العملاء ووجدت علاقة ارتباط ذات دلالة إحصائية بين مشتريات البيرة ومشتريات 
الحفاضات. وقد وُجد أن السبب في ذلك هو أن الآباء (الذين يفترض أنهم شباب) كانوا يتوقفون في 
السوبر ماركت لشراء حفاضات لأطفالهم (خاصةً أيام الخميس)» ولأنهم م يَحُد بإمكانهم النزول إلى 
ساحة الرياضة في كثيرٍ من الأحيانء مثلما لم يعد بإمكانهم شراء البيرة أيصًا. ونتيجة لذلك يزعم أن 
سلسلة المتاجر الكبرى وضعت الحفاضات بجانب البيرة؛ مما أدى إلى زيادة مبيعات كليهما. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YAO‏ 








الفصل الرابع 


ويهدف استخراج قاعدة المجموعات في جوهره إلى إيجاد علاقات مثيرة للاهتمام (الصلات) 
بين المتغيرات (البنود) في قواعد البيانات الكبيرة. وبسبب تطبيقه الناجح لمشكلات تجارة التجزئة؛ 
فإنه يُطلّق dalos Šole ale‏ سلة السوق. وتتمثل الفكرة الرئيسية في تحليل سلة السوق في 
تحديد العلاقات القوية بين المنتجات المختلفة (أو الخدمات) التي يتخ شراؤها عادةً معًا (تظهر في 
نفس السلة معَاء إما سلة مادية في متجر للبقالة أو سلة افتراضية على موقع للتجارة الإلكترونية). 
فمثلًا يشتري 10* من أولئك الذين يشترون تأميئًا شاملًا للسيارات التأمين الصحي أيضًا. و٠۸‏ 
من أولئك الذين يشترون الكتب عبر الإنترنت يشترون الموسيقى عبر الإنترنت أيضّا؛ بالإضافة إلى 
أن >1٠‏ من أولئك الذين لديهم ارتفاعٌ في ضغط الدم وزيادة الوزن؛ لديهم ارتفاع كوليسترول في 
الدم؛ و٠2۷‏ من العملاء الذين يشترون حاسباً محمولاً وبرامج الحماية من الفيروسات يشترون 
أيضًا خطط خدمة مُوسّعة. 

وتتمثل المدخلات في تحليل سلة السوق في بيانات معاملات نقطة البيع البسيطة؛ إذ يتم 
تبويب عدد من المنتجات أو الخدمات التي تمَّ شراؤها معًا (تمامًا مثل محتوى إيصال الشراء) في 
حالة معاملة واحدة. وتُّعَد نتيجة التحليل بمثابة معلومات لا تُقدَّر بثمن والتي يمكن استخدامها 
لفهم سلوك الشراء لدى العملاء بشكلٍ أفضل لتحقيق أقصى قدرٍ من الرّبح من المعاملات التجارية؛ 
إذ تستفيد الأعمال التجارية من هذه المعرفة عبر: 
-١‏ وَضْعَ العناصر بعضها بجانب بعض؛ لجعلها أكثر ملاءمةً للعملاء لالتقاطها معا وعدم نسيان 

شراء واحدة عند شراء الأخرى (زيادة حجم المبيعات). 
۲- الترويج للبنود كحزمة (لا تضع واحدةً للبيع إذا كان الآخرون معروضين للبيع). 
- وضعها بعضها بعيدًا عن بعض؛ بحيث يكون على العميل المشي في الممرات للبحث عنه؛ Wig‏ 

من خلال القيام بذلك من المحتمل رؤية وشراء سلع أخرى. 

وتشتمل تطبيقات تحليل سلة السوق على التسويق المتقاطع؛ والبيع المتقاطع» وتصميم 
ا متجرء وتصميم الكتالوج» وتصميم موقع التجارة الإلكترونية؛ بالإضافة إلى تحسين الإعلان عبر 
الإنترنت» وتسعير المنتج؛ فضلًا عن تكوين المبيعات/ الترويج؛ إذ يساعدٌ تحليل سلة السوق في 
جوهره الشركات على استنتاج احتياجات العملاء وتفضيلاتهم من أنماط الشراء. وخارج نطاق 
عاط الأعمال؛ فإن قواعد المجموعات تُستَخدَّم بنجاح لاكتشاف العلاقات بين الأعراض والأمراض 
والتشخيص وخصائص وعلاجات المريض (التي يمكن استخدامها في نظام دَعْم القرار الطبي) 
والجينات ووظائفها (التي يكن استخدامها في مشاريع الجينوميات)» من بين أمور أخرى. وفيما 
يلي بعض المناطق والاستخدامات الشائعة لاستخراج قاعدة المجموعات: 


vM‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عمليةء وطرق» وخوارزميات التنقيب في البيانات 


- معاملات البيع: يمكن استخدامٌ مجموعات من منتجات التجزئة التي تم شراؤها معًا لتحسين 
موضع انتج في الطابق المخصّص للمبيعات (وضع المنتجات التي تتماثى بعضها مع بعض) 
والتسعير الترويجي للمنتجات (وليس وجود عروض ترويجية dS Je‏ من المنتجات التي يتم 
شراؤها في الغالب معًَا). 
- معاملات بطاقات الائتمان: توفر العناصر المشتراة من خلال بطاقة ائتمانية بيانات عن منتجات 
أخرى يُرجَّح قيامٌ العميل بشرائها أو استخدام أرقام بطاقات الائتمان. 
- الخدمات المصرفية: يمكن استخدام أنماط الخدمات المتسلسلة التي يستخدمها العملاء (فحص الحساب 
متبوعًا بحساب التوفير) لتحديد الخدمات الأخرى التي قد يكونون مهتمين بها (حساب استثماري). 
- منتجات خدمات التأمين: يمكن استخدامٌ حزم منتجات التأمين التي يشتريها العملاء (التأمين 
على السيارات يتبعها التأمين المنزلي) لاقتراح منتجات تأمين إضافية (التأمين على الحياة)» أو 
مزيج غير عادي من مطالبات التأمين يمكن أن يكون علامةٌ على الاحتيال. 
- خدمات الاتصالات: تساعد مجموعات الخيارات التي تمّ شراؤها بشكل عام (مثل: انتظار 
المكالمات» وهوية المتصلء والاتصال الثلاقي) على تكوين حزم المنتجات بشكل أفضل لزيادة 
الإيرادات. وينطبق الشيء نفسه على مُرْوّدي خدمات الاتصالات المتعددة القنوات من خلال 
الهاتف والتلفزيون وعروض خدمة الإنترنت. 
- السجلات الطبية: يمكن أن تشير توليفات معينة من الحالات إلى زيادة خطر حدوث مضاعفات 
مختلفة؛ أو يمكن ربط بعض إجراءات العلاج في بعض المرافق الطبية بأنواع معينة من العدوى. 
إن أفضل سؤال ينبغي طرحه فيما يخضٌ الأأماط/ العلاقات التي يمكن أن تكتشفها قواعد 
مجموعات الاستخراج هو «هل كل قواعد الترابط مثيرة للاهتمام ومفيدة؟» وللإجابة عن سؤال من 
هذا القبيل؛ فإن قواعد ترابط الاستخراج تستخدم مقياسين شائعين: الدعم والاعتدال والرفع. وقبل 
تعريف هذه المصطلحات؛ دعنا نحصل على القليل من التقنية من خلال إظهار شكل قاعدة الارتباط: 
[حاسب محمولء برامج مكافحة الفيروسات] ١‏ [خطة الخدمة الموسعة] [٠9/ل ANS‏ 
حيث ترتبط × (المنتجات أو الخدمةء تسمى الجانب الأيسر» 1148ء أو سابقة) ب ۷ (المنتجات 
أو الخدمة»ء وتسمى الجانب الأمنء RHS‏ أو مرافقه). و5 هو الدعم: و0 هي الثقة لهذه 
القاعدة الخاصة. فيما يلي الصيغ البسيطة Lifts Confs Supp J‏ | 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YN‏ 


الفصل الرابع 


number of baskets tbat contains botb X and Y 


total number of baskets‏ کک 


Supp(X= Y) 


Confidence = Conf(X = Y) = 000لا‎ 


SX => b 
Conf(X =» Y) 89 — SX2Y 
Expected Comf X=Y) 4AD) MY) 
500 


Lif(X= Y) = 


إن الدّعم (5) لمجموعة من المنتجات هو مقياس مدى تكرار ظهور هذه المنتجات أو الخدمات 
(مثل 2115 + 1:15 - الحاسب المحمول وبرامج مكافحة الفيروسات وخطة الخدمة الموسّعة) 
في نفس المعاملة؛ أيْ: نسبة المعاملات في مجموعة البيانات التي تحتوي على جميع المنتجات أو 
الخدمات المذكورة في قاعدة مُحدّدة. وفي هذا ا مثال كانت >٠١‏ من جميع المعاملات في قاعدة 
بيانات المتجر الافتراضية تحتوي على جميع المنتجات الثلاثة الموجودة في بطاقة مبيعات واحدة. 
وثقة القاعدة هي مقياس مدى تلازم ا منتجات أو الخدمات في ۸۲48 (الناتجة) مع ا منتجات أو 
الخدمات على نظام ig (Blu) LHS‏ نسبة المعاملات التي تتضمّن نظام 1148 في حين تتضمّن 
أيضَا 8115. وبعبارة أخرى؛ فإن الاحتمال المشروط هو العثور على 11515 للقاعدة الموجودة في 
المعاملات التي يُوجَد بها بالفعل نظام 1,515 للقاعدة. وقيمة الرفع لقاعدة الارتباط هي نسبة 
ثقة القاعدة والثقة المتوقعة من القاعدة. ويتمُ تعريف الثقة المتوقعة للقاعدة على أنها نتاج قيم 
دعم 1,115 و1115 مقسومًا على دعم نظام 115.آ. 

وتتوفر عدَّة خوارزميات لاكتشاف قواعد الترابط؛ إذ تتضمّن بعض الخوارزميات المعروفة 
Eclat Apriori‏ بالإضافة إلى 82-0101011. وتقوم هذه الخوارزميات فقط بنصف المهمة, وهو 
تحديد العناصر المتكررة في قاعدة البيانات. وحاما يتم تحديد العناصر المتكررة؛ فإنها تحتاج إلى 
تحويلها إلى قواعد مع الأجزاء السابقة واللاحقة؛ إذ إِنَّ تحديد القواعد من المواد المتداولة هو 
عملية مطابقة مباشرة؛ لكن العملية قد تستغرق وقنًا طويلًا مع قواعد بيانات المعاملات الكبيرة. 
وعلى الرغم من أنه يمكن أن يكون هناك العديد من العناصر في كلّ مقطع من القاعدة؛ فإِنَّ 
الجزء الذي يترتب على ذلك عادةً ما يحتوي على عنصر واحد. وف القسم التالي سوف نتناول 
شرح إحدى الخوارزميات الأكثر شيوعًا لتحديد العناصر المتكررة. 


YM‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات التنبؤية (1): عملية» وطرقء وخوارزميات التنقيب في البيانات 


خوارزمية 11011م4: وهو النظام الأكثر استخدامًا لاكتشاف قواعد الارتباط. وبالنظر إلى 
مجموعة من العناصر (مثل مجموعات من معاملات البيع بالتجزئةء وكل عنصر من العناصر 
الفردية التي تمّ شراؤها). تحاول هذه الخوارزمية العثور على مجموعاتٍ فرعية شائعة على الأقل 
كحَدَ أدنى لعدد العناصر (أَيْ: إنها تتوافق مع الحد الأدنى من الدعم). ويستخدم 41011 أسلوبًا 
من القاعدة إلى القمة؛ إذ يتم توسيعٌ مجموعات فرعية متكررة عنصرًا S d Vols‏ مرة (وهي 
طريقة تُعرّف باسم جيل المرشح؛ إذ يزدادُ حجم المجموعات الفرعية المتكررة من مجموعات فرعية 
ذات عنصر واحد إلى مجموعات فرعية من فئتين» ثم مجموعات فرعية ثلاثية العناصر... الخ)» ويتم 
اختبار مجموعاتٍ من المرشحين في كلّ مستوى ضد البيانات؛ للحصول على الحَدَّ الأدنى من الدعم. 
وتنتهي الخوارزمية عند عدم العثور على ملحقات إضافية ناجحة. 

وكمثالٍ توضيحي: ضَعٌ في اعتبارك ما يلي: يتتبع متجر البقالة عمليات نقل المبيعات بواسطة 
511 (وحدة حفظ المخزون)»» وبالتالي يعرف العناصر التي يتم شراؤها عادةً معًا. يظهر في 
الشكل ١5-6‏ قاعدة بيانات المعاملات: إلى جانب الخطوات اللاحقة لتحديد العناصر المتكررة. 
وکل رمز 5110 في قاعدة بيانات المعاملة يتحول إلى منتج؛ مثل: »1 = «butter‏ و»2 = «bread‏ 
و«3 = Wate‏ وما إلى ذلك. تتمثل الخطوة الأول في ġ Apriori‏ حساب الترددات (أيْ: 
الدعامات) لكل عنصر (عناصر من عنصر واحد). ولهذا ا مثال المبسّط بشكل كبيرء دعنا نعيّن 
الحد الأدق للدعم إلى ۴ (أو 20١‏ مما يعني أن العنصر يُعَدُ عنصرًا متكررًا إذا تمّ عرضه في 
٠“‏ من أصل 5 معاملات على الأقل في قاعدة البيانات). ونظرًا لأن جميع العناصر المكونة من 
عنصر واحد تحتوي على de Y‏ الأقل في عمود الدعم؛ فكلها polie AS‏ متكررة. ومع ذلك؛ فإنه 
إذا لم تكن أي من عناصر المجموعة الواحدة متكررة؛ فلن يتم إدراجها كعضو محتمل في زوجين 
من النقاط محتملين. وبهذه الطريقة: يُحرّر 11013م4 شجرة جميع العناصر الممكنة. وكما يوضح 
الشكل 5-6١؛‏ فإنه باستخدام عناصر مجموعة واحدة: يتم إنشاء جميع عناصر العناصر ALl‏ 
ويتم استخدام قاعدة بيانات المعاملة لحساب قيم الدعم الخاصة بها. ونظرًا لأن عنصر العناصر 
المكون من عنصرين [1. 1 يحتوي على دَعْم أقل من "؛ فلا يجب تضمينه في العناصر المتكررة 
التي سيتخٌ استخدامها لإنشاء مجموعات العناصر التالية (عناصر من العناصر الثلاثة). وتبدو 
هذه الخوارزمية بسيطةً بشكلٍ خادع؛ ولكن فقط لمجموعات البيانات الصغيرة. أما في مجموعات 
البيانات الأكبر بكثير - خاصة تلك التي تحتوي على كميات هائلة من العناصر الموجودة بكميات 
منخفضة وكميات صغيرة من العناصر الموجودة في كميات كبيرة - فإن البحث والحساب يصبح 
عملية مكثفة من حيث الحساب. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YN‏ 


الفصل الرابع 


















مجموعات بتود ثلاثية البند ‏ مجموعات بنود ثنائية البدد مجموعات بنود أحادية البئد ابيانات العملية الخام 
مجمو عة البند مجموعة البند 
cus | e skus) | e‏ 
3 12.4 3 12 1001234 
| 3 2,3,4 2 1.3 1001235 
3 1,4 1001236 
4 2,3 1001237 
5 2,4 1001238 
3 3,4 1001239 


























شكل :١4-6‏ تحديد مجموعات البنود المتكررة في خوارزمية 411011 


أسئلة مراجعة على القسم 0-6: 

-١‏ حَدّد على الأقل ثلاث طرق من الطرق الرئيسة للتنقيب في البيانات. 

às 4 Jl , S31 -Y‏ افق ass‏ أن يكون فيها التصنيف أسلوباً مناسباً للتنقيب في البيانات. 
واذكر أمثلةً على الحالات التي يكون فيها الانحدارٌ أسلوبًا مناسبًا للتنقيب في البيانات. 

-Y‏ اذكر على الأقل اثنين من تقنيات التصنيف مع تعريفٍ موجز لهما. 

ع- ما هي بعض المعايير لمقارنة واختيار أفضل تقنية rem‏ 

ه- صف باختصار الخوارزمية العامة المستخدمة في أشجار القرار. 

e -1‏ مؤشر جيني. واذكر ماذا يقيس؟ 

- ما هو نموذج المجموعة في مجال التنقيب في البيانات؟ ما هي مزايا وعيوب نماذج المجموعة؟ 

8- اذكر أمثلةَ للمواقف التي سيكون فيها التحليل التجميعي تقنيةً مناسبةً لاستخراج البيانات. 

-١‏ ما هو الفرق الرئيس بين التحليل التجميعي والتصنيف؟ 

-٠‏ اذكر بعض طرق التحليل التجميعي؟ 

-١‏ اذكر أمثلةَ على الحالات التي يكون فيها الارتباط تقنية مناسبة للتنقيب في البيانات. 


ع-7 أدوات برمجيات التنقيب في البيانات: 


يوفر العديدٌ من مورّدي البرامج أدوات قويةً للتنقيب في البيانات. من أمثلة هؤلاء الموردين: 


(Clementines SPSS PASW Modeler e..b والمعروفة سابقًا‎ :181/1 SPSS Modeler) MBI شركة‎ - 


Ya.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 






































التحليلات التنبؤية (1): عملية» وطرقء وخوارزميات التنقيب في البيانات 


- شركة 545 (رائدة المشروعات). 
- شركة 12611 «Statistica)‏ والمعروفة سابقًا «(StatSoft Statistica Data Miner eb‏ 
- شر Infinite Insight) PAS ås,‏ والمعروف سابقًا KXEN Infinite Insight ewl‏ 
.(CART, MARS, TreeNet, RandomForest) ڌرgأllw a‏ 
-Angoss (KnowledgeSTUDIO, KnowledgeSEeker) à$ 5 -‏ 
-Megaputer (PolyAnalyst) à$ 5 -‏ 

بشكل ملحوظ ولكن ليس من امستغرب» يتم تطوير أدوات التنقيب في البيانات الأكثر شيوعًا 
واستخدامًا من قبل شركات البرمجيات الإحصائية الراسخة إلى حد كبير (مثل 56815016 ,5555 ,545)؛ 
لأن الإحصاءات هي أساس التنقيب في البيانات» وهذه الشركات لديها وسائل فعالة من حيث 
التكلفة تقوم بتطويرها في أنظمة الإستخراج الشامل للبيانات. كما أن معظم مُورّدي أدوات ذكاء 
-Tableaus .SAP Business Objects; .Oracle Hyperions .IBM Cognos :J£s) JU. eV‏ 
$42-J (Microsoft ; .Teradatas .MicroStrategy  .Qliks .Tibcos‏ أيضًا مستوى معين من 
قدرات التنقيب في البيانات امُدمَجة في عروض البرامج الخاصة بهم. ولا تزال أدوات ذكاء الأعمال 
هذه تركّز في المقام الأول على النمذجة المتعددة الأبعاد وتصوير البيانات» ödla Élis AS Yg‏ 
مورّدي أدوات التنقيب في البيانات. 

إضافةً إلى هذه الأدوات التجارية؛ تتوفر العديدُ من أدوات برمجيات جمع البيانات المفتوحة 
المصدر أو المجانية على الإنترنت. وبشكلٍ بديهي - ولا سيما في الإدارات التربوية - تُعَذّ 11/818 أداة 
التنقيب في البيانات ا مجانية والمفتوحة الأكثر انتش ارا والتي تمّ تطويرها من قبل عددٍ من الباحثين 
à Waikato áxalz (a‏ نيوزيلندا (يمكن تنزيل الأداة gg (cs. waikato.ac.nz/ml/weka (5s‏ 
2 على عدد كبيرٍ من الخوارزميات لمهاءٌ مختلفة للتنقيب في البيانات ولديها واجهة 
مُستخدم سهلة الاستخدام. وقد ظهر في الآونة الأخيرة عددٌ من الأدوات المجانية ا لمفتوحة 
المصدر وذات قدرة عالية على التنقيب في البيانات: يقود المجموعة (6.018تضنص!) KNIME‏ 
Olazls lap. :RapidMiner (quickminer.com)s‏ مُستخدم aiios dolo‏ وأيضًا بهما 
عد كبيرٌ من الخوارزميات» ومجموعة متنوعة من مَيّزات التمثيل البصري للبيانات» كل تلك 
الخصائص تميزهما عن بقية الأدوات المجانية. ويُكَدٌ هذان البرنامجان ا مجانيان أيصًا برنامجين 
أساسيين (أيْ: تمكن تشغيلهما على نظامي 25 gas (Macs Windows Jis‏ التغيير الأخير في 
عروضها؛ قامت 102/11061م112 بإنشاء نسخة مُصغّرة من أداة التحليلات الخاصة بهم مجانًا 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري للها 


الفصل الرابع 


(أيّْ: نسحة مجتمعية)؛ وذلك في أثناء تصنيع المنتج التجاري الكامل. لذلك؛ فبمجرد إدراج 
1161 ضمن فئة الأدوات المجانية/ مفتوحة المصدرء غالبًا ما يتم إدراجها في قائمة الأدوات 
التجارية. يُعَن الاختلاف الرئيس بين JS‏ من الأدوات التجارية )مژJ: SAS Enterprise Miner‏ 
«RapidMiners .Weka :J.is) à 3l! clssVls (Statistica .IBM SPSS Modelers‏ 
و12113/1) هو الكفاءة الحسابية. وقد تستغرق مهمة التنقيب في البيانات نفسها التي تتضمن 
مجموعة بيانات كبيرة وغنية بالميزات وقتاً أطول بكثير لتكتمل مع أدوات البرمجيات المجانية, 
وبالنسبة لبعض الخوارزميات» قد لا تكتمل المهمة (أيْ: تتعطل بسبب الاستخدام غير الفعّال 
لذاكرة الحاسب). يعرض الجدول ١-6‏ بعضًا من المنتجات الرئيسة والمواقع الخاصة بها. 

هناك مجموعةً من قدرات ذكاء الأعمال والتحليلات التي أصبحت أكثر شيوعًا بشكلٍ متزايد 
لدراسات التنقيب في البيانات. وهي 501.561765 111705016 (فقد تم تضمينها لإمكانات 
تحليلات أكثر بشكل متزايدء مثل ذكاء الأعمال ووحدات النمذجة التنبؤية؛ وذلك بدءًا من إصدار 
ex 3l «SQL Server 2012‏ عمل مستودعات البيانات والنماذج في نفس بيئة قاعدة البيانات 
العلائقية؛ مما يجعل إدارة النماذج Aga‏ ا Microsoft Enterprise Als hw . So‏ 
كمصدر عالمي للوصول إلى مجموعة برامج 5617615 :501 :211205015 للأغراض الأكاديمية, 
كالتدريس والأبحاث. وقد تم إنشاءٌ هذا التحالف؛ لتمكين الجامعات في جميع أنحاء العام 
من الوصول إلى تقنية المؤسسات دون الحاجة إلى صيانة الأجهزة والبرامج الضرورية في مبانيها 
الخاصة. كما يوفر التحالف مجموعةً واسعةً من أدوات تطوير ذكاء الأعمال (كالتنقيب في 
البيانات» بناء المكعبات» إعداد تقارير الأعمال) إضافةً إلى عدد من مجموعات البيانات الكبيرة 
والواقعية من Microsoft Enterprise ¡lla 5 - Tyson Foodss Dillard'ss Sam's Club‏ 
مجانيًا ولا مكن استخدامه إلا للأغراض الأكادمية. تستضيف كلية 11731608 .2/1 53 للأعمال 
بجامعة 411822535 النظام المؤسسي وتسمح لأعضاء التحالف وطلابه بالوصول إلى هذه الموارد 
باستخدام اتصال بسيط عن بعد بسطح المكتب. ويمكن معرفة تفاصيل الانضمام لهذا التحالف 
وكذلك الدروس Bla‏ المتابعة وبعض الأمثلة في -walton.uark.edu /enterprise‏ 


yay‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية ellas (V)‏ وطرقء وخوارزميات التنقيب في البيانات 


جدول 6-؟: برامج مختارة للتنقيب في البيانات 


اسم المنتج 
IBM SPSS Modeler‏ 


IBM Watson Analytics 

SAS Enterprise Miner 

Dell Statistica 

PolyAnalyst 

CART, RandomForest 
Insightful Miner 

XLMiner 

SAP InfiniteInsight (KXEN) 
GhostMiner 

SQL Server Data Mining 


Knowledge Miner 


Teradata Warehouse Miner 


Oracle Data Mining (ODM) 
FICO Decision Management 
Orange Data Mining Tool 


Zementis Predictive Analytics 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





(URL) g$sll 


www-0l.ibm.com/software/analytics/spss/products/ 


modeler/ 

ibm.com/analytics/watson-analytics/ 

sas.com/en id/software/analytics/enterprise-miner.html 
statsoft.com/products/statistica/product-index 
megaputer.com/site/polyanalyst.php 
salford-systems.com 
solutionmetrics.com.au/products/iminer/default.html 
solver.com/xlminer-data-mining 

help.sap.com/ii 

fqs.pl/ghostminer 
msdn.microsoft.com/en-us/library/bb510516.aspx 
knowledgeminer.com 


teradata.com/products-and-services/Teradata- 


warehouse-miner/ 
oracle.com/technetwork/database/options/odm/ 


fico.com/en/analytics/decision-management-suite/ 
orange.biolab.si/ 


zementis.com 


yar 



























































الفصل الرابع 


في Syal eY- V1 gsl‏ 5.6072اعع2118 1212 استطلاع البرامج السنوي الثالث عشر بشأن السؤال 

التالي: «ما هي البرامج التي استخدمتها في التحليلات» والتنقيب في البيانات» وعلم البيانات» ومشاريع 

ele‏ الآلة خلال ال ١7‏ شهرًا الماضية؟». وقد حظي الاستطلاع بمشاركة رائعة من مجتمع التحليلات 

وعلم البيانات والمورّدين؛ مما جذب 18813 ناخبًا اختاروا عددًا قياسيًا بلغ ٠١1‏ من الأدوات المختلفة. 

وقد أثمر هذا الاستطلاع عن بعض النتائج المثيرة للاهتمام منها: 

- لا تزال ۸ هي الأداة الرئيسةء بحصة تبلغ ٤6٩‏ من الأسهم (بعد أن كانت ZETA‏ في عام ٠10‏ لام): 
ولكن استخدام 700202( ازداد بسرعة واکتسب ما يقرب من ۸ بحصة ٤0,۸‏ من الأسهم 
(والتي توقفت عند ۰,۳ في 16 ١لم).‏ 

- لا تزال Rp Mi‏ هي ال منصة العامة الأكثر انتشارًا بشأن التنقيب في البيانات/ علم البيانات» 
بنسبة بلغت <۲١‏ من الأسهم. ومن الأدوات البارزة التي تحظى بأكبر قدر من النمو في الانتشار 
هي scikit- ARR MAE Learningg «H209 «MLlibg «Dataikug «Dato‏ 
.IBM Watsong dearn‏ 

- ينعكس الخيار المتزايد للأدوات في الاستخدام الأوسع؛ إذ بلغ متوسط عدد الأدوات المستخدمة 
۰ (مقابل ٤,۸‏ في مايو 16١7م).‏ 

- ارتفع استخدام أدوات OLLI /Hadoop‏ الكبيرة إلى 1/9 بعد أن كان 75 في عام 10١٠م‏ 
و۷ MLlibs Apache Spark (13 5a i534 «Y VE ele (à‏ (مكتبة els) Spark‏ الآلة) 
و0. والتي أدرجناها ضمن أدوات البيانات الكبيرة. 

- كانت المشاركة حسب المنطقة؛ وذلك كالتالي: الولايات المتحدة / keat (489) bgal (XE) IUS‏ 
(:#9): أمريكا اللاتينية (0,۸<)ء أفريقيا / الشرق الأوسط (۲,۹)ء أستراليا / نيوزيلندا (۲,۲). 

- في هذا العام» استخدم ۸1> من ا مصوتين برامج تجاريةء في حين استخدم ۷0> البرامج المجانية. 
واستخدم حوالي ۲١‏ فقط البرامج التجاريةء و١٠‏ فقط استخدموا البرامج المفتوحة المصدر / 
ا مجانية. واستخدم الأغلبية مقدار >1١‏ كلا من البرامج ال مجانية والتجارية على dels a X6‏ 
حين كانت 1٤‏ فی عام ۲۰۱۵ م. 

- بالنسبة للسنة الثانية» شمل استطلاع KDnuggets.com‏ أدوات elsi‏ العميق. ففي هذا 
العام استخدم ۱۸> من المصؤتين أدوات التعلم العميقء أيّْ: ضعف نسبة عام «eY* VO‏ والتي 
كانت 5“. وبهذا قفز موقع 1825014016 600816 إلى المركز الأول» متخطيًا النظام البيئي 
2 مصاحب الصدارة في العام الماضي. 


vae‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات التنبؤية :)١(‏ عمليةء وطرقء وخوارزميات التنقيب في البيانات 


CIC 


لفات برمجة وبيائات أخري 


Salford. SPM/CART/RF/MARS/TreeNet 
Gnu Octave 











Source: used with permission from KDnuggets 


شكل 10-6: الأدوات البرمجية الشائعة للتنقيب في البيانات 
ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


- في مجتمع لغات البرمجةء ارتفعت شعبية Javas Python 3s Js‏ وUnix‏ وaاSca؛‏ ف à‏ 
انخفضت شعبية Juliag Perlg «C/C++ ùنم Js‏ وغ .Lisps «Clojures .F‏ 
وللحَد من التحيّز في التصويت المتعَدَّد؛ قام  KDnuggets.com gàss‏ هذا الاستطلاع 
بالتحقق من البريد الإلكتروني؛ وذلك بهدف جَعْل النتائج أكثر تمثي كا للواقع في عام التحليلات. 
m‏ في الشكل 10-6 نتائج لأفضل ٠١‏ من الأدوات البرمجية (وذلك وفقًا لإجمالي عدد الأصوات 
المستلمة). كما يقوم الرسم البياني الأفقي أيضًا بالتمييز بين الأدوات المجانية/ مفتوحة المصدر 
والتجارية وبيانات 118000 / البيانات الضخمة باستخدام مخطط الترميز ذي الألوان. 


yso 








الفصل الرابع 


حالة عملية ٠-٤‏ 
التنقيب في البيانات ينتقل إلى هوليوود: توقع النجاح المالي للأفلام 

تتعلّق الحالة العملية ع- بدراسة بحثية؛ إذ يتم استخدام عدد من الأدوات البرمجية 
وتقنيات جمع البيانات لبناء نماذج التنقيب في البيانات؛ للتنبؤ بالنجاح Ohly) YU‏ 
شباك التذاكر) لأفلام هوليوود في حين أنها ليست أكثر من مجرد أفكار. 

يعد توقع إيرادات شباك التذاكر (أيْ: النجاح المالي) لصورة متحركة معينة؛ مشكلةً 
ilog plia yio‏ بالتحديات. ووفقاً لبعض خبراء المجال؛ فإن صناعة السينما 
تُعَدُ «أرض العقبات والمخاطر الجامحة»؛ بسبب الصعوبة المرتبطة بالتنبؤ بالطلب 
على المنتج؛ مما يجعل أعمال السينما في هوليوود محفوفةً بالمخاطر. ودعمًا لمثل 
هذه الملاحظات. يقول 17816211 ع3[ (الرئيس والمدير التنفيذي السابق لاتحاد الصور 
المتحركة الأمريكية): «لا أحد يستطيع أن يخبرك كيف سينتج الفيلم في السوق» ليس 
قبل أن يفتح الفيلم في مسرح مظلم: والشرر يطير بين الشاشة والجمهور». وقد 
كانت الصحف والمجلات التجارية الخاصة بصناعة الترفيه مليئةً بالأمثلة والتصريحات 
والخبرات التي تدعم مثل تلك المطالب. 

وكما هو الحال بالنسبة للعديد من الباحثين الذين حاولوا إلقاء الضوء على هذه المشكلة 
المليئة بالتحَدّيات في العام الحقيقي» كان ds‏ من Dursun Delens .Ramesh Sharda‏ 
يستكشفان استخدام التنقيب ف البيانات؛ للتنبؤ بالأداء المالي للصورة امتحركة في شباك 
التذاكر قبل أن يدخل الإنتاج (في حين أن الفيلم ليس أكثر من فكرة مفاهيمية). وفي نماذج 
التنبؤ ذات الانتشار الكبيرء يتمُ تحويل مشكلة التنبؤ (أو الانحدار) إلى مشكلة تصنيف؟ 
بمعنى أنه بدلًا من التنبؤ بتقدير نقطة لإيرادات شباك التذاكر؛ يتم تصنيف أيّ فيلم وفقًا 
لإيراداته ووضعه في إحدى الفئات التسع» والتي تتراوح من الهبوط dl «flop» wasl‏ 
الإقبال «#اءنا)ءهاا»؛ مما يجعل المشكلة مشكلة تصنيف متعددة الحدود. ويُوضُح 
الجدول ٠-٤‏ تعريف الفئات التسع من حيث نطاق إيصالات شباك التذاكر. 


TABLE 4.3 Movie Classification Based on Receipts 
Class No. l 1 1 4 5 6 7 8 3 
Range >l >l >O >Ð >Ð > >W >l >W 


(inmilions Fo) <60 <0 «64 «&& <60 <6l0 <60  (Bodbuser) 
of dollars) 








yar‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات التنبؤية :)١(‏ عملية» وطرقء وخوارزميات التنقيب في البيانات 


البيانات: 


تمّ جمع البيانات من مجموعة متنوعة من قواعد البيانات المتعلقة بالأفلام (مثل: 
e 385 (L5 £5 .BoxofficeMojos .AllMovies IMSDbs .IMDbs «Showbiz‏ 
دمجها جميعًا في مجموعة بيانات واحدة؛ إذ تحتوي مجموعة البيانات الخاصة بأكثر 
النماذج تطورًا في الآونة الأخيرة على ۲۱۳۲ فیلماً تمّ إصدارها بين عامي ۱۹۹۸ و٠٠٠٠.‏ 
ويعرض الجدول 6-6 ملخصاً للمتغيرات المستقلة إلى جانب مواصفاتها. ولمزيدٍ من 
التفاصيل الوصفية ومبرّرات تضمين هذه المتغيرات المستقلة؛ يتم الاطلاع على oe JS‏ 


.Delen (2006)5 Sharda 


جدول :٤-٤‏ ملخص للمتغيرات المستقلة 


المتغير المستقل 


تصنيف الاتحاد الأمريكي للصور التحركة 
MPAA‏ 


امنافسة 


قيمة النجم 
النوع الأدبي 


مؤثرات خاصة 


متمم 
عدد الشاشات 





المنهجية: 





عدد القيم 





القيم الممكنة 
G, PG, PG-13, R, NR‏ 


خيال علميء دراما ملحمية تاريخية: دراما 
bas‏ سياسة:. b]‏ رعب. كوميدياء كرتون» 
حريء وثائقي 

نعم لا 


عدد صحيح موجب بین ۱ و٣۳۸۷‏ 





باستخدام مجموعة متنوعة من أساليب التنقيب قي البيانات» بما في ذلك الشبكات 
العصبية وأشجار القرار وآلة المتجهات الداعمة وثلاثة أنواع من المجموعات؛ قام كل من 
48 1261629 بتطوير نماذج التنبؤ. وقد تمّ استخدامٌ بيانات الحقبة الزمنية من 
إلى 0١٠٠م‏ كبيانات تدريبية لبناء نماذج التنبؤ في حين استخدمت بيانات عام 
٠٠م‏ كبيانات اختبار لتقييم ومقارنة دقة التنبؤات في النماذج. ويعرض الشكل ١7-6‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


yav 





























الفصل الرابع 


لقطة شاشة من öləÎ) IBM SPSS Modeler‏ التنقيب في البیانات (GL. Clementine‏ 
التي تصوّر خريطة العملية المستخدمة بمشكلة التنبؤ؛ إذ يعرض الجانب الأيسر العلوي 
للخريطة عملية تطوير النموذج» ويعرض الركن السفلي الأمن من الخريطة عملية 
تقييم النموذج (أيْ: الاختبار أو التسجيل). ولمزيد من التفاصيل حول أداة 182/5855 

6 هوكذلك استخدامها فَيُرْجََى الرجوع إلى موقع الكتاب على شبكة الإنترنت 


بیانات 
1996-2005 


ا 


200 








شكل 15-6: لقطة لتدفق عملية نظام التنبؤ بشباك التذاكر 
النتائج: 
يقدّم الجدول 0-6 نتائج التنبؤ لجميع طرق الجمع الثلاث للبيانات بالإضافة إلى 
نتائج المجموعات الثلاث المختلفة. يُكَدُ أول قياس للأداء هو معدل التصنيف الصحيح 
للنسبة المئوية» ويُطلّق عليه «1280ا». وكما ورد في الجدول معدل التصنيف الصحيح 
I-Away‏ (أيْ: ضمن فئة واحدة). تشير النتائج التي يعرضها الجدول إلى أن 5772/1 كان 
أفضل نماذج التنبؤ الفردية: يليها 47173؛ في حين حلت خوارزمية شجرة قرار '04187 في 
ا مركز الأخير كأسوا JS às qood‏ عام؛ حققت نماذج المجموعة أداءً أفضل من نماذج 
التنبؤ الفردية» التي أَدّتَ خوارزمية الاندماج فيها أفضل أداءٍ ممكن: Spa idy‏ 
المعياري المنخفض للغاية الذي تم الحصول عليه من المجموعات هو - على الأرجح - 
أكثر أهمية لصانعي القرار وقراءة جدول النتائج» مقارنة بالنماذج الفردية. 


YSA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التنبؤية :)١(‏ عملية» وطرقء وخوارزميات التنقيب في البيانات 


جدول 0-6: نتائج التنبق المجدولة للنماذج الفردية والجماعية 





نماذج التنبؤ 
النماذج - 
: النماذج الجماعية 
الفردية 


الغابة | الشجرة | الاندماج 
العشوائية | ا مدعومة | (متوسط) 


ME D 19 Mee Y 14۹۲ (bingo) 4I 


CART | ANN | SVM | مقياس الأدء‎ 


Ww. ع1‎ Ww 1۲1 Ww. ١٠١ | (1-Away) axll 
L 
Xom, V | Xo£,.0 | ZW;ot | Z£s,€1 | Z«,0Y | Z£3,00 | (bingo) الدقة‎ 


XAVO | ZVSA€ || ZAS | ZAA,V1 | ZYA,AV | ZA0,00 | (C1-Away) 48JJl 


























SWOD o SA ۷1 V0 | SM | SAY. | الانحراف امعياري‎ 
الاستنتاج:‎ 

يدَّعي الباحثون أنَّ نتائج التنبو هذه أفضل من أيّ تقارير منشورة فيما يتعلق 
بنطاق هذه المشكلة. وبالإضافة إلى الدقة الجذابة لنتائج التنبؤ بإيرادات الشباك؛ 
فإنه يمكن استخدام هذه النماذج كذلك لتحليل متغيرات القرار (وربما تحسينها) 
لتعظيم العائد المالي. وعلى وجه التحديد؛ يمكن تغيير المعلمات المُستَخدّمة 
للنمذجة باستخدام نماذج التنبؤ المجرّبة بالفعل للوصول إلى فهم أفضل لتأثير 
المعلمات المختلفة على النتائج النهائية. وخلال هذه العملية: والتي تُسمّى عادةً 
«تحليل الحساسية»؛ يمكن لصانع القرار في إحدى الشركات الترفيهية أن يكتشف» 
بمستوى دقة عالٍ do 45 YI‏ مقدار قيمة النجاح المالي التي يمكن أن يحققها ممثل 
معين (أو تاريخ صدور محدد. أو إضافة المزيد التأثيرات الفنية... إلخ)؛ مما يجعل 
النظام الأساسي أداةً لا تُقدَّر بثمن لدعم القرار. 
أسئلة للمناقشة: 
-١‏ للماذا يعتبر التنبؤ بالنجاح المالي للأفلام أمرًا مهما بالنسبة للعديد من صناع 
السينما في هوليوود؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yaa‏ 


























الفصل الرابع 


AS -Y‏ يمكن استخدام التنقيب في البيانات للتنبؤ بالنجاح المالي للأفلام قبل بدء 
عملية الإنتاج؟ 

*- كيف تعتقد أن هوليوود نجحت في هذه المهمة إلى الآن دون مساعدة من 
أدوات وتقنيات التنقيب في البيانات؟ 


Sources: Sharda, R., & Delen, D. (2006). Predicting box-office success of motion 
pictures with neural networks. Expert Systems with Applications, 30, 243254-; 
Delen, D., Sharda, R., & Kumar, P. (2007). Movie forecast Guru: A Web-based DSS 
for Hollywood managers. Decision Support Systems, 43(4), 11511170-. 


أسئلة مراجعة على القسم 5-6: 

-١‏ ما هي أدوات التنقيب في البيانات التجارية الأكثر انتشارًا؟ 

AST of aiz ISU -Y‏ الأدوات انتشارًا يتمُ تطويرها من قبل الشركات القائمة على الإحصاء؟ 

- ما هي أكثر أدوات التنقيب في البيانات المجانية انتشارًا؟ ولماذا تتمتع بهذا الانتشار الهائل (خاصة 12)؟ 

-٤‏ ما هي الاختلافات الرئيسة بين أدوات البرمجيات التجارية وأدوات التنقيب في البيانات المجانية؟ 

0- ما هي معايير الاختيار الخمسة الأولى لأداة التنقيب في البيانات؟ اشرح إجابتك. 

۷-٤‏ مشكلات خصوصية التنقيب في البيانات» والخرافات» والأخطاء الفادحة: 
غالبًا ما تحتوي البيانات التي يتم جمعها وتخزينها وتحليلها في مجال التنقيب في البيانات على 

معلومات حول الأشخاص الحقيقيين. وقد تتضمن هذه المعلومات ما يلي: 

-١‏ بيانات التعريف (الاسم. والعنوان» ورقم الضمان الاجتماعيء ورقم رخصة القيادة. ورقم 
الموظف» وما إلى ذلك). 

؟- البيانات الدمموغرافية (مثل: العمرء والجنسء والعرقء والحالة الاجتماعية. وعدد الأطفال). 

“- البيانات المالية (مثل: الراتبء أو دخل الأسرة الإجمالي» أو التحقق من رصيد الحساب أو التوفيرء 
أو ملكية المنزل: أو تفاصيل حساب الرهن العقاري أو القرضء أو حدود بطاقات الائتمان 
والأرصدة. أو تفاصيل حساب الاستثمار). 

ع- تاريخ الصفقات المبرّمة (أيْ: ما يتم شراؤه من أين ومتى» سواء من سجلات المعاملات الخاصة 
بالبائع أو من ا معاملات الخاصة ببطاقة الائتمان). 

0- البيانات الشخصية (مثل: ذكرى الزواج السنوية» الحملء المرضء الوفيات في العائلة, إيداعات الإفلاس). 


£e‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية dalos :)١(‏ وطرق» وخوارزميات التنقيب في البيانات 


ويمكن الوصول إلى معظم هذه البيانات من خلال بعض مقدّمي البيانات التابعين لجهات 
خارجية. والسؤال الرئيس هنا هو عن خصوصية الشخص الذي تنتمي إليه البيانات. وللحفاظ 
على خصوصية وحماية حقوق الأفراد؛ يجب أن يتمتع متخصصو التنقيب في البيانات بسمات 
أخلاقية فضلًا عن الالتزامات القانونية. وتتمثل إحدى طرق تحقيق ذلك في عملية إلغاء تحديد 
سجلات العملاء قبل تطبيق تطبيقات التنقيب في البيانات؛ بحيث لا يمكن تتبّع السجلات للفرد. 
وقد تمّ بالفعل إلغاء تحديد العديد من مصادر البيانات المتاحة للجمهور CDC Olly idis)‏ 
بيانات (UNOS cU SEER‏ وقبل الوصول إلى مصادر البيانات هذه. يطلب من المستخدمين 
في كثير من الأحيان الموافقة على أنهم - تحت أيّ ظرف من الظروف - سيحاولون تحديد هوية 
الأفراد الذين يقفون وراء هذه الأرقام. 

كان هناك عددٌ من الحالات في الماضي القريب؛ إذ شاركت بعض الشركات بيانات العملاء 
مع الآخرين دون الحصول على موافقة صريحة من عملائها. فعلى سبيل المثال - كما قد يتذكر 
معظمكم - في عام ١٠٠م:‏ قدّمت شركة 5©هناءنةى Ogle ġo ASL ioll Maul JetBlue‏ 
مسافر Torch Concepts 4S åI as go‏ وهي مقاولة حكومية أمريكية. ثم قامت Torch‏ 
بعد ذلك بتعزيز بيانات الركاب بمعلومات إضافية مثل: أحجام العائلة وأرقام الضمان الاجتماعي» 
وهي معلومات تم شراؤها من وسيط بيانات يُسمَّى 465102. وكان القصد من قاعدة البيانات 
الشخصية الموحّدة أن تُستَخدّم في مشروع التنقيب في البيانات؛ بغرض التنبق بملامح الإرهاب 
المحتمل. وقد تمّ كلّ هذا دون إخطار أو موافقة الركاب. وعندما خرجت أخبار تلك الأنشطة؛ 
تم تقديمٌ العشرات من قضايا الخصوصية ضد 8106]ة1 ودكء10' وده نعف ودعا العديد من 
أعضاء مجلس الشيوخ الأمريكي إلى إجراء تحقيق في الحادث (2004 ,18814). وخرجت في الماضي 
القريب أخبارٌ ممائلةٌ متعلقة بالخصوصية عن شركات الشبكات الاجتماعية الشهيرة» والتي أشيع 
أنها كانت تبيع بيانات خاصة بالعملاء إلى شركات أخرى للتسويق المستهدف الشخصي. 

كانت هناك قصةٌ غريبةٌ أخرى عن مخاوف الخصوصية التي وصلت إلى عناوين الأخبار في عام 
aY Y‏ في هذه الحالة» لم تستخدم الشركة حتى أي بيانات خاصة و/ أو شخصية. من الناحية 
القانونية» لم يكن هناك انتهاكٌ لأية قوانين. وتلخص الحالة العملية 6-/ تلك القضية - والمتعلقة 
بشركة ]12186 - بشيء من التفصيل. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £1 


الفصل الرابع 


حالة عملية ۷-٤‏ 
توقع أنماط شراء العملاء - قصة Target‏ 

تدور القصة حول فتاة مراهقة كانت تشارك منشورات إعلانية وكوبونات من قبل 
]1886 لأنواع الأشياء التي تشتريها السيدة الحامل Target Jio paia Ga JIII öp‏ 
تقول القصة: ذهب رجل غاضب إلى شركة Olha Minneapolis gjlL-> Target‏ 
بالتحدث إلى أحد المديرين؛ فقال: «استلمت ابنتي هذا منكم عن طريق البريد إنها 
لا تزال في المدرسة الثانوية وترسلون لها كوبونات بللابس الأطفال وأسرّة الأطفال حديثي 
الولادة. هل تحاولون تشجيعها على الحمل؟». لم يكن لدى المدير أي فكرة عمًا يتحدث 
عنه الرجل. نظر في امرّل؛ فوجد أنها كانت موجّهة إلى ابنة الرجل وتضمّنت إعلانات 
عن ملابس الأمومة وأثاث الحضانة وصور الرضع. اعتذر المدير ثم اتصل بعد بضعة أيام 
على الهاتف للاعتذار bya‏ أخرى. ومع ذلك؛ بدا الأب متضايقاً إلى حدٌ ما عندما $y‏ على 
المدير قائلًا: «لقد تحدثت مع ابنتي وتبَيّن لي أن هناك بعص الأنشطة في منزلي لم أكن على 
دراية بها. إنها في انتظار مولودها الأول بالفعل وأنا مدينٌ لك باعتذار». ولكن السؤال 
هنا كيف عرفت 185866 أن الفتاة كانت حاملًا قبل اكتشاف والدها للحقيقة؟ وفيما 
يلي الإجابة عن هذا السؤال: إن شركة 15866" تُخصّص لكلّ عميل رقم بطاقة تعريف 
كضيف لديها (مرتبطة ببطاقة الائتمان» أو الاسم أو عنوان البريد الإلكتروني) الذي يصبح 
عنصرًا نائبًا يحتفظ JS) Joao‏ ما اشتراه. وتقوم 1٥۲86٤‏ بتعزي ز هذه البيانات باي 
معلومات دهوغرافية قاموا بجمعها من العملاء أنفسهم» أو تم شراؤها من مصادر 
معلومات أخرى. وباستخدام هذه امعلومات؛ نظرت شركة Target‏ في بيانات الشراء 
السابقة لجميع الإناث اللواتي قمن بتسجيل أسمائهن في سجلات أمهات الأطفال المنتظر 
استقبالهم. وقاموا بتحليل البيانات من جميع الاتجاهات» وسرعان ما ظهرت بعض 
الأنماط المفيدة. فعلى سبيل المثال: كانت مستحضرات اللوشن والفيتامينات الخاصة 
من بين المنتجات ذات أنماط الشراء المثيرة للانتباه. فالكثيرُ من الناس يشترون اللوشنء» 
ولكن ما لاحظوه هو أن السجلات التي تحتوي على بيانات سيدات ينتظرن أطفال 
يقمن بشراء كميات أكبر من محلول اللوشن غير المعطر مع بداية الثلث الثاني من فترة 
الحمل. ولاحظ محللٌ آخر أنه في وق ما في الأسابيع العشرين الأولى من فترة الحملء 
تقوم النساء الحوامل بالاعتماد على المكملات مثل: الكالسيوم والمغنيسيوم والزنك. كما 
يقوم العديدٌ من المتسوّقين بشراء صابون وكرات قطنية» ولكن عندما تبدأ سيدة ما فجأة 


£e‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية :)١(‏ عملية وطرق» وخوارزميات التنقيب في البيانات 


بشراء الكثير من الصابون الخالي من الرائحة وأكياس كبيرة من كرات القطنء بالإضافة إلى 
مطهرات اليد ومناديل الحمام؛ فإن ذلك يشير إلى قرب موعد استقبالها لمولودها. وفي 
النهاية؛ تمكّنوا من تحديد حوالي 0! منتجّاء عندما تم تحليلها مكًَاء مكّنتهم من تحديد 
درجة توقع وجود حمل من عدمه لكل متسوق. والأهم من ذلك؛ استطاعت Target‏ 
أيضًا تقدير تاريخ الولادة لكلّ سيدة حامل؛ لذلك يتم إرسال كوبونات منتجات معينة 
بتواريخ مُحدّدة JSI‏ متسوقة بحسب ال مرحلة التي تمر بها في حملها. 

إذا نظرت إلى هذه الممارسة من منظور قانوني؛ فستستنتج أن ع۲٩1‏ مم تستخدم 
أيّ معلومات تنتهك خصوصية العميل؛ إنهم فقط استخدموا بيانات المعاملات التي 
تقوم كلّ سلسلة تجارة التجزئة الأخرى تقريبًا بجمعها وتخزينها (ورها تحليلها) حول 
عملائها. ولكن ما كان مزعجًا في هذا السيناريو ربما كان المفهوم المستهدف: الحمل. 
فهناك بعض الأحداث أو المفاهيم يجب أن تكون غير قابلة للتداول أو أن يتم التعامل 
معها بحذر شديد. مثل: أمراض الشيخوخة» والطلاق» والإفلاس. 

أسئلة للمناقشة: 


-١‏ ما رأيك في التنقيب في البيانات وتأثيرها على الخصوصية؟ وما هي العتبة 
الفاصلة بين اكتشاف المعرفة وانتهاك الخصوصية؟ 

- هل أخطأت 7866ة1؟ هل فعلت أيّ شيء غير قانوني؟ برأيك» ما الذي كان يجب أن 
تفعله ]13186؟ وهل يجب على 131866 الإقلاع عن هذه الأنواع من الممارسات مستقبلًا؟ 
Sources: Hill, K. (2012, February 16). How Target figured out a teen girl was pregnant‏ 


before her father did. Forbes; Nolan, R. (2012, February 21). Behind the cover story: 


How much does Target know? NYTimes.com. 


خرافات وأخطاء فادحة حول التنقيب في البيانات: 

يُعَدَُ التنقيبُ في البيانات أداةً تحليلية قويةً تكن المديرين التنفيذيين من التقدِّم في وصف 
طبيعة الماضي (بالنظر إلى مرآة الرؤية الخلفية) للتنبؤ بالمستقبل (النظر إلى الأمام) لإدارة عملياتهم 
التجارية بشكلٍ أفضل (اتخاذ قرارات دقيقة وفي الوقت المناسب). تساعد عملية التنقيب في 
البيانات جهات التسويق في العثور على أنماط تفصح عن أسرار تتعلّق بسلوك العملاء. يمكن 
استخدام نتائج التنقيب في البيانات لزيادة الإيرادات وخفض التكلفة من خلال تحديد الاحتيال 
واكتشاف الفرص التجارية؛ مما يوفر مناخًا جديدًا تمامًا وجيدًا للمَيْزة التنافسية. وكحقل متطور 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري er‏ 


الفصل الرابع 


وناضجء يرتبط التنقيب في البيانات غالبًا بعدد من الخرافات» والتي يعرض الجدول 5-6 بعضًا منها 
.(Delen, 2014; Zaima, 2003)‏ 
جدول 1-6: خرافات التنقيب في البيانات 

الخرافة الواقع 
يوفر التنقيب في البيانات تنبؤات تشبه كرة | تُعَدُّ عملية التنقيب ف البيانات عمليةً متعددة الخطوات 
بلورية فورية. تتطلب تصميمًا واستخدامًا متعمدًا واستباقيًا. 
التنقيب في البيانات غير قابلٍ للتطبيق مع | الحالة الحالية للتنقيب في البيانات جاهزةٌ للاستعمال 
تطبيقات الأعمال السائدة. تقريبًا لأيّ نوع أو حجم عمل. 
يتطلب التنقيبُ في البيانات قاعدة بيانات | بسبب التقدِّم في تقنية قاعدة البيانات؛ لا يلزم وجود 
منفصلة ومُخصّصة. قاعدة بيانات مخصصة. 
يمكن فقط للأشخاص ذوي الدرجات العلمية | تمكّن الأدوات الحديثة القائمة على الويب المديرين من جميع 
المتقدّمة القيام بالتنقيب في البيانات. المستويات التعليمية من القيام بعملية التنقيب في البيانات. 
التنقيب في البيانات هو فقط للشركات | إذا كانت البيانات تعكسٌ بدقة الأعمال أو عملائهاء هكن 
الكبيرة التي لديها الكثير من بيانات العملاء. | لأيّ شركة استخدام التنقيب في البيانات. 











لقد اكتسب مناصرو التنقيب في البيانات فائدةً تنافسيةً هائلة من خلال فهم أنَّ هذه الخرافات 
هي مجرد: خرافات. وعلى الرغم من أن قيمة الاقتراح وبالتالي ضرورة وجودها واضحة لأيّ شخص؛ 
فإن أولئك الذين ينفذون مشاريع التنقيب في البيانات سواءً المبتدئ أو عام البيانات المتمرس 
يرنكبون أخطاءً أحيانًا تؤدي إلى مشاريع ذات نتائج أقل من المرغوب فيها. ونعرض فيما يلي ١7‏ 
من الأخطاء الشائعة في التنقيب في البيانات» ويجب أن يكون علماء البيانات على دراية بها. وعليه 
يتحتم عليهم بذل قصارى جهدهم لتجنبها N5†‏ وآخرون 2001 Shultz, 2004; Skalak,‏ 2009: 
-١‏ اختيار مشكلة خطأ للتنقيب في البيانات: فلا هكن حل كلّ مشكلة تجارية بالتنقيب في 
البيانات (أيْ: متلازمة الطلقة السحرية). وعندما لا توجد بيانات تمثيلية (كبيرة وغنية 
بالميزات)» فلا يمكن أن يكون هناك مشروع استخراج بيانات عملي. 
- تجاهل مايعتقده الداعمون في ما يمكن فعله وما لا يمكن فعله باستخدام التنقيب في البيانات: 
فإدارة التوقعات هي مفتاح نجاح مشاريع التنقيب في البيانات. 


tt‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 























التحليلات التنبؤية (1): عملية» وطرق» وخوارزميات التنقيب في البيانات 


۳- البدء دون وَضْع تصور للنهاية: على الرغم من أن التنقيب في البيانات هو عملية اكتشاف 
للمعرفة؛ فإنه يجب أن يكون لدى المستخدم هدفٌ (مشكلة أعمال محددة) في ذهنه للنجاح. 
لأنه. وكما يقول المثل: «إذا كنت لا تعرف إلى أين أنت ذاهب؛ فلن تصل إلى هناك أبِدَّا». 

> تحديد المشروع الذي لا تدعمه بياناتك: يُعَد التنقيب في البيانات هو كل شيء عن البيانات؛ بمعنى 
أن القيد الأكبر لديك في مشروع التنقيب في البيانات هو ثرا البيانات. فمعرفة حدود البيانات 
تساعدك على صياغة مشاريع قابلة للتطبيق وتحقق النتائج المرجوة منها وتفي بالتوقعات. 

ه- تحديد وقتٍ غير كاف لإعداد البيانات: إذ يتطلّب التجهيرٌ مجهودًا أكبر من المتوقع غالبًا. 
حيث تشير المعرفة الشائعة إلى أن ما يصل إلى ثلث إجمالي وقت المشروع يتم استهلاكه على 
مهام جمع البيانات» وفهمهاء وتجهيزها. ولتحقيق النجاح؛ تجنّب البدء في النمذجة قبل أن 
تتم معالجة بياناتك بشكل صحيح (بحيث تكون متكاملة ومُنظّفة ومُحَوّلة). 

-١‏ النظر فقط في النتائج المجمّعة وليس في السجلات الفردية: يكون التنقيب في البيانات في 
أفضل حالاته عندما يتم تمثيل البيانات بشكل دقيق. Liz Jalo‏ تجميع البيانات وتبسيطها 
بشكل لا ذاعي له يلساعدة خوارزميات التنقيب في البيانات؛ فهي لا تحتاج إلى مساعدتك 
ا quali‏ قدرةنفاققة عان :فل كل ذلك اسا 1 

۷ الوقوع في فخ تتبّع إجراءات ونتائج التنقيب: ولأنها عمليةٌ اكتشاف تنطوي على العديد من 
التكرارات والتجارب؛ فمن ال مرجًّح أن تفقد مسار النتائج. يتطلب النجاح تخطيطًا ممنهجًا 
ومنظمًا وتنفيدًا وتتبُعًا / تسجيلًا لجميع مهام التنقيب في البيانات. 

-A‏ استخدام بيانات مستقبلية للتنبؤ بالمستقبل: يسبب عدم وجود وصف وفهم للبيانات» في كثير 
من الأحيان يقوم glih‏ البيانات بتضمين متغيرات غير معروفة في الوقت الذي من المفترض 
أن يتم التنبؤ فيه. ومن خلال القيام بذلك؛ تنتج نماذج التنبؤ الخاصة بها نتائج دقيقة لا يمكن 
تصديقها (وهي ظاهرة يُطلق عليها غالبًا «ذهب الأغبياء»). وإذا كانت نتائج التنبؤ الخاصة 
بك جيدة جدًا لدرجة يضعب تصديقها؛ فإنها عادةٌ ما تكون كذلك؛ وفي هذه الخالة: فإن أول 
شيء تحتاج للبحث عنه هو الاستخدام غير الصحيح لمتغير من المستقبل. 

9- تجاهل النتائج المشبوهة وانتقل بعيدًا عنها بسرعة: غالبًا ما تكون النتائج غير المتوقعة هي 
مؤشرات المستجدات الحقيقية في مشاريع التنقيب في البيانات. ويمكن أن يؤدي التحقيق 
السليم في مثل هذه النتائج الشاذة إلى اكتشافات مثيرة للدهشة. 

-٠‏ البدء بمشروع مجمع رفيع المستوى من شأنه أن يجعلك نجمًا فوق العادةً: غالبًا 

ما تفشل مشاريع التنقيب في البيانات إذا لم يتم التفكير فيها بعناية من البداية إلى النهاية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل الرابع 


فغالبًا ما يأقٍ النجاح بتقدّم منتظم ومنظم للمشاريع من الصغيرة / البسيطة إلى 
الكبيرة / المعقدة. ويجب أن يكون الهدف هو إظهار القيمة المضافة التدريجية والمستمرة: 
بدلا من الدخول في مشروع كبير يستهلك الموارد دون إنتاج أيّ نتائج ذات قيمة. 


-١‏ تشغيل خوارزميات التنقيب في البيانات بشكل متكرّر وأعمى: على الرغم من أن أدوات 


التنقيب في البيانات اليوم قادرةٌ على استهلاك البيانات وإعداد معلمات خوارزمية لتحقيق 
نتائج؛ فإنه ينبغي لمستخدم البيانات معرفة كيفية تحويل البيانات وتعيين قيم المعلمات 
المناسبة للحصول على أفضل النتائج الممكنة. فلكلٌ خوارزمية طريقةٌ فريدةٌ خاصةٌ بها لمعالجة 
البيانات» ومعرفة ما هو ضروري للحصول على أقصى استفادة من كلّ نوع من أنواع النماذج. 


- تجاهل خبراء الموضوع: يتطلّب فهم نطاق المشكلة والبيانات ذات الصّلة تعاونًا شديدًا 


بين التنقيب في البيانات وخبراء المجال. فالعمل الجماعي يساعد خبير التنقيب في البيانات 
على تجاوز التمثيل النحوي والحصول أيضًا على الطبيعة الدلالية (أيْ: المعنى الحقيقي 
للمتغيرات) للبيانات. 


- تصديق كل ما قيل لك عن البيانات: على الرغم من ضرورة التحدٌّث إلى خبراء ا مجال لفهم 


البيانات ومشكلة العمل بشكل أفضل؛ فَإنَّ عام البيانات يجب ألا يأخذ أيّ شيء على أنه 
أمرّ مُسلَّمٌ به. إن الفاعلية والتحقق من خلال التحليل النقدي هما مفتاح الفهم الحميم 
للبيانات ومعالجتها. 


ME‏ افتراض أن حُماة البيانات سيتواجدون بشكل كاملٍ للتعاون في أيّ وقت يُطلب منهم ذلك: 


-M 


تفشل العديدٌُ من مشاريع التنقيب في البيانات؛ لأن خبير التنقيب في البيانات لا يعرف/ 
لا يفهم السياسات التنظيمية. قد يكون أحد أكبر العقبات في مشاريع التنقيب في البيانات هم 
الأشخاص الذين يملكون البيانات ويسيطرون عليها. إن فهم وإدارة السياسة هو مفتاح تحديد 
البيانات والوصول إليهاء وفهمها بشكل صحيح لإنتاج مشروع ناجح للتنقيب في البيانات. 


- اختلاف معيار قياس النتائج بين المحلل وصاحب البيانات: يجب أن توجّّه النتائج إلى 


المستخدم النهائي (المدير / صانع القرار) الذي سيستخدمها. وبالتالي؛ فإن تقديم النتائج 
في مقياس وشكل يجذب المستخدم النهائي يزيد بشكل كبير من احتمالية الفهم الحقيقي 
والاستخدام السليم لنتائج التنقيب في البيانات. 

إذا قمت ببنائه؛ فسيأق: لا تقلق بشأن كيفية تقدمه: عادةً يعتقد خبراء التنقيب في 
البيانات أنها تتم بمجرد إنشاء نماذج جيدة تلبّي وتزيد على احتياجات / متطلبات / توقعات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): عملية» وطرقء وخوارزميات التنقيب في البيانات 


المستخدم النهائي (أيْ: العميل). وبدون انتشار جيد؛ تكون القيمة المحدّدة لنتائج التنقيب 
في البيانات محدودةً نوعًا ما. لذلك؛ Asi‏ الانتشار خطوةً أخيرةً ضروريةً في عملية التنقيب 
في البيانات؛ إذ يتم دَمْج النماذج في البنية التحتية لدعم القرار التنظيمي؛ من أجل تمكين 
عملية اتخاذ القرار بشكلٍ أفضل وأسرع. 


أسئلة مراجعة على القسم :۷-٤‏ 

-١‏ ما هي مشكلات الخصوصية في التنقيب في البيانات؟ 

؟- كيف تعتقد أن يتحسّن النقاش بين الخصوصية والتنقيب في البيانات؟ وماذا؟ 

- ما هي أكثر الخرافات شيوعًا حول التنقيب في البيانات؟ 

l -£‏ رأيك في أسباب هذه الخرافات حول التنقيب في البيانات؟ 

-٥‏ ما هي الأخطاء الأكثر شيوعًا في التنقيب في البيانات؟ وكيف يمكن تخفيفها أو القضاء عليها تمامًا؟ 


تلخيص لأهمّ نقاط الفصل: 

- يُعَذّ التنقيبُ في البيانات عمليةٌ لاكتشاف المعرفة الجديدة من قواعد البيانات. 

oS -‏ أن يستخدم التنقيب في البيانات ملفات مسطحة بسيطة كمصادر بيانات أو يمكن تنفيذها 
على بيانات في مستودعات البيانات. 

- هناك العديدُ من الأسماء والتعريفات البديلة للتنقيب في البيانات. 

- يتواج د التنقيب ف البيانات في تقاطع العديد من التخصصات» ما في ذلك الإحصاء والذكاء 
الاصطناعي والنمذجة الرياضية. 

- تستخدم الشركات التنقيب في البيانات؛ لفهم عملائها بشكلٍ أفضل وتحسين عملياتها. 

- يمكن العثور على تطبيقات التنقيب في البيانات في كلّ مجال من مجالات الأعمال والحكومة: بما 
في ذلك الرعاية الصحية والمالية والتسويق والأمن الداخلي. 

- يُحَدُ كلّ من التنبؤ (التصنيف أو الانحدار)» والتجميع, والترابط ثلاث فئاتٍ واسعة من مهام 
التنقيب في البيانات. 

- مثل مبادرات التعزيز المؤسسي الأخرى؛ يجب أن يتبع مشروع استخراج البيانات عملية منهجية 
لإدارة المشاريع لتكون ناجحة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ev‏ 


الفصل الرابع 


- تمّ اقتراح العديد من عمليات التنقيب في البيانات: «CRISP-DM‏ و55:813/4: و1221 وما إلى ذلك. 

- يوفْر 08158-514 طريقةً منتظمةً ومنظمةً لإجراء مشاريع التنقيب في البيانات. 

- تستهلك الخطوات السابقة في مشاريع التنقيب في البيانات (أيْ: فهم المجال والبيانات ذات 
الصّلة) معظم الوقت الإجمالي للمشروع (غالبًا ما يزيد عن >۸٠‏ من الوقت الإجمالي). 

- تعد المعالجة الأوّلية للبيانات أمرًا ضروريًا لأيّ دراسة ناجحة للتنقيب في البيانات؛ إذ تؤدي 
البيانات الجيدة إلى معلومات جيدة. والمعلومات الجيدة تؤدي إلى قرارات جيدة. 

- تتضمّن معالجة البيانات الأؤلية أربع خطوات رئيسة: OLLI giS‏ وتنظيف البيانات» وتحويل 

البيانات» وتقليل حجم البيانات. 

تتعلّم مناهج التصنيف من الأمثلة السابقة التي تحتوي على مدخلات وعلامات الفئات الناتجة, 

وبمجرد أن يتم تدريبهم بشكلٍ صحيح؛ يكونون قادرين على تصنيف الحالات المستقبلية. 

- يت تجميعٌ سجلات نمط الأقسام إلى شرائح أو مجموعات طبيعية؛ بحيث يتشابه أعضاء كل 

شريحة في خصائص معينة. 

يتم استخدام عددٍ من الخوارزميات المختلفة بشكلٍ شائع بغرض التصنيف. وتشمل التطبيقات 

.SPRINT5 .CHAIDs .CART5 .C55 .C4.55 123 التجارية‎ 

تقوم أشجار القرار بتقسيم البيانات عن طريق التفرّع عبر سمات مختلفة؛ بحيث يكون JSJ‏ 

مجموعة أوراق نمط فئوي مشترك. 

يُعَذُ مؤشر 101 والحصول على المعلومات (الانتروبيا)؛ طريقتين شائعتين لتحديد خيارات التفرّع 

في شجرة القرار. 

- يقيس مؤشرٌ ندا نقاء العينة. فإذا كان US‏ شيء في عينة ينتمي إلى فئة واحدة» تكون قيمة 
مؤشر Gini‏ صفر. 

- تستطيع عدة تقنيات تقييم أن تقيس دقة التنبؤ لنماذج التصنيف» ها في ذلك التقسيم البسيطء 
التحقق المتقاطع ع8ذمم 60015653 .1-1010 وا مساحة تحت منحنى (10©0. 

- يتم استخدام خوارزميات التجميع عندما لا تحتوي سجلات البيانات على معرّفات فئة معرفة 

مسبقًا (معنىء» لا يُعرف إلى الفئة التي ينتمي إليها سجل معين). 

تحسب خوارزميات التجميع مقاييس التشابه؛ من أجل تجميع حالات مماثلة في مجموعات. 

sd -‏ قياس المسافة هو مقياس التشابه الأكثر استخدامًا في التحليل التجميعي. 

- يُعَنُ كلّ من K-٠٠١5‏ والخرائط ذاتية التنظيم؛ هما أكثر خوارزميات التجميع شيوعًا. 


i 


EA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية «olas (Y)‏ وطرقء وخوارزميات التنقيب في البيانات 


- يُستخدّم التنقيب في قواعد الارتباط؛ لاكتشاف اثنين أو أكثر من العناصر (أو الأحداث 
أو المفاهيم) التي تذهب معا. 


- يُشار عادةً إلى التنقيب في قواعد الارتباط مصطلح تحليل سلة السوق. 


- إنَّ خوارزمية الارتباط الأكثر استخدامًا هي 10:1:م4؛ إذ يتم تحديد العناصر المتكرّرة من خلال 


اتباع نهج تصاعديّ (من أسفل إلى أعلى). 
- يتم تقييم قواعد الارتباط بناءً على مقاييس الدَّعم والثقة المتعلقَيْن بها. 


- تتوفر العديد من أدوات التنقيب في البيانات سواء كانت مجانية أو بمقابل مادي. 
- إن أدوات التنقيب في البيانات التجارية الأكثر شعبية هي -SAS Enterprise Miner g:SPSSPASW‏ 


- إن أشهر أدوات التنقيب في البيانات المجانية هي -RapidMinerg Weka‏ 


مصطلحات أساسية: 
Apriori 455 ls2-‏ 


ROC 
ارتباط‎ 
Bootstrapping 


بيانات تسلسلية 


CRISP-DM 








ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


شجرة القرار 
قياس اممسافة 
طاقم 
إنتروبيا 
Giit Ais‏ 
lass] quus‏ 


بيانات فاصلة 


التحقق ب س / جزء 


KNIME 


اكتشاف المعرفة في قواعد 
(KDD) obl‏ 


تحليل الارتباط 
Microsoft Enterprise‏ 
التحالف 
خادم مايكروسوفت .501 
نيانات اسمية 
بيانات رقمية 


بيانات ترتيبية 





RapidMiner 


انحدار 
SEMMA‏ 

تسلسل التنقيب 

التقسيم البسيط 


الدعم 
Weka‏ 





التنقيب في البيانات 


£43 
































الفصل الرابع 


أسئلة للمناقشة: 

-١‏ عرّف التنقيب في البيانات. لماذا هناك العديدٌ من الأسماء والتعريفات للتنقيب في البيانات؟ 

۲- ما هي الأسباب الرئيسة وراء الرّواج الحديث للتنقيب في البيانات؟ 

۳- ناقش ما يجب على ا منظمة مراعاته قبل اتخاذ قرارٍ بشراء برنامج التنقيب في البيانات. 

-٤‏ قارن بين التنقيب في البيانات والأدوات والتقنيات التحليلية الأخرى. 

5- ناقش طرق التنقيب في البيانات الرئيسة. وما هي الاختلافات الأساسية فيما بينها؟ 

-٦‏ ما هي مجالات التطبيق الرئيسة للتنقيب في البيانات؟ ناقش القواسم المشتركة لهذه المجالات 
التي تجعلها فرصةً لدراسات التنقيب في البيانات. 

ahga idas d| glas ISU -V‏ للتنقيب في البيانات؟ وما هي عمليات التنقيب في البيانات الأكثر شيوعًا؟ 

۸- ناقش الاختلافات بين عمليتَيْ التنقيب في البيانات الأكثر استخدامًا. 

9- هل تُكَنُ عمليات التنقيب في البيانات مجرد مجموعة متسلسلة من الأنشطة؟ اشرح إجابتك. 

-٠١‏ اذا نحتاج إلى المعالجة المسبقة للبيانات؟ وما هي المهامٌ الرئيسة والتقنيات ذات الصلة 
dados‏ المعالجة المسبقة للبيانات؟ 

-١‏ ناقش الأسباب الكامنة وراء تقييم نماذج التصنيف. 

۲- ما هو الفرق الرئيس بين التصنيف والتجميع؟ اشرح إجابتك باستخدام أمثلة من الواقع. 

-١‏ بالانتقال إلى ما بعد مناقشة هذا الفصلء أين يمكن استخدام الارتباط؟ 

-٤‏ ما هي مشكلات الخصوصية في التنقيب في البيانات؟ هل تعتقد أنها موثقة؟ 

-٥‏ ما هي الخرافات المتداولة والأخطاء الأكثر شيوعًا حول التنقيب في البيانات؟ 

تمارين: شبكة جامعة تيراداتا (1017) وغيرها من التمارين اليدوية: 


قم .teradatauniversitynetwork.com 8)b js‏ 335 دراسات الحالة والأوراق البيضاء حول التنقيب 
في البيانات. وقم بوصف التطورات الحديثة في مجال التنقيب في البيانات والنمذجة التنبؤية. 


à .teradatauniversitynetwork.com |J] Jl -Y‏ موقع ندوات الويب المتعلقة بالتنقيب 
في البيانات. على وجه الخصوصء حَدّد موقع حلقة دراسية قدَّمها كلَّ من '#مطصتة .© 
و201065 :1. شاهد ندوة الويب. ثم أجب عن الأسئلة التالية: 


£V‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): عملية» وطرقء وخوارزميات التنقيب في البيانات 


-١‏ اذكر بعض تطبيقات التنقيب في البيانات المثيرة للاهتمام؟ 

-١‏ ما هي أنواع المكاسب والتكاليف التي يمكن أن تتوقعها المنظمات من مبادرات التنقيب في البيانات؟ 

- بالنسبة لهذا التمرين» يتمثل هدفك في بناء موذج لتحديد المدخلات أو المتنبئات التي تميّز 
العملاء المحفوفين بالمخاطر من الآخرين (بناءً على الأنماط المتعلقة بالعملاء السابقين) ثم 
استخدام هذه المدخلات للتنبؤ بعملاء جدد محفوفين بالمخاطر. تُعَذَّ هذه العينة نموذجيةٌ 
لهذا المجال. وبيانات النموذج المراد استخدامه في هذا التمرين هي في ملف 114.1 Online‏ 
في ملف <01601]1151315. تتضمّن مجموعة البيانات 470 حالة و0١‏ متغيرًا متعلقًا بالعملاء 
السابقين والحاليين الذين اقترضوا من أحد البنوك لأسباب مختلفة. كما تحتوي على معلومات 
متعلقة بالعميل مثل الوضع المالي» وسبب القرض» والتوظيف» واطمعلومات الدهوغرافية 
والنتيجة أو المتغير التابع للمركز الائتمانيء مع تصنيف كلّ حالة على أنها جيدة أو سيئة, 
e clo‏ تجربة المؤسسة السابقة. خُذْ 600 من الحالات كحالات تدريب وقم بتخصيص 
0 حالة أخرى للاختبار. قم ببناء نموذج شجرة قرارات بلعرفة خصائص المشكلة. اختبر أداء 
هذا النموذج على ١0‏ حالة أخرى. ثم قم بإعداد تقريرين: أحدهما عن أداء التعلم والاختبار 
في نموذجك. والآخر لتحديد نموذج شجرة القرار ومعلمات التدريب. بالإضافة إلى الأداء 
الناتج في مجموعة الاختبار. يمكنك استخدام أيّ برنامج لشجرة القرارات. (عكك68ءه ونط]” 
is courtesyof StatSoft, Inc., based on a German data set from ftp.ics.uc;i.edu/‏ 
databases-learning-machine/طuم‏ / يدف هذا التمرين إلى تعريفك بتعدين القاعدة. 
.(statlog/german renamed CreditRisk and altered‏ 

-٤‏ بالنسبة لهذا التمرين» ستقوم بتكرار (على نطاق أصغر) نمذجة شباك التذاكر الموضّح في 
الحالة العملية ع-1. قم بتنزيل مجموعة بيانات التدريب من كلَّ من 114.2 1:16 عصئله0: 
Microsoft Excel Guiu (125 .MovieTrain.xlsxs‏ استخدم وصف البیانات الموضّح في 
الحالة العملية 7-6 لفهم المجال والمشكلة التي تحاول حلها. قم بانتقاء واختيار المتغيرات 
المستقلة الخاصة بك. قم بتطوير ثلاثة نماذج تصنيف على الأقل (على سبيل ام مثالء شجرة 
القرارات» الانحدار اللوجستيء الشبكات العصبية). قارن نتائج الدقة باستخدام تقنيات 
-055ه 10-1014 والتقسيم المثوي واستخدم كذلك مصفوفات الدقة ثم ae‏ 
على النتيجة. اختبر النماذج التي قمت بتطويرها على مجموعة الاختبار (انظر ملف الإنترنت 
MovieTest.xlsx‏ 1174.3). قم بتحليل النتائج بنماذج مختلفةء مع وضع أفضل نموذج 
تصنيف» ودعمه مع نتائجك. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £M‏ 


gil! الفصل‎ 


5- يهدف هذا التمرين إلى تقديمك إلى التنقيب في قواعد الارتباط. تحتوي مجموعة بيانات 
de Excel baskets1ntrans.xlsx‏ ۲۸۰۰ ملاحظة / سجل لبيانات منتجات السوبر ماركت. 
يحتوي كل سجل على بطاقات تعريف للعملاء والمنتجات التي قاموا بشراتها. استخدم 
مجموعة البيانات هذه لفهم العلاقات بين المنتجات (أيْ: المنتجات التي يتم شراؤها معًا). 
ابحث عن العلاقات المثيرة. وأضف لقطات شاشة (SS‏ أنماط ارتباط خفية قد تجدها. وبشكلٍ 
أكثر تحديدًاء أجب عن الأسئلة التالية: 

-١‏ ما هي قواعد الارتباط التي تعتقد أنها الأكثر أهمية؟ 
؟- استنادًا إلى بعض قواعد الارتباط التي وجدتهاء قم بإجراء ثلاث توصيات أعمال على الأقل 
قد تكون مفيدة للشركة. قد تتضمّن هذه التوصيات أفكارًا حول تنظيم الرّف أو بيع 
المنتجات. (سيتمٌ مَنْحِ نقاط مكافأة للأفكار الجديدة / المبتكرة). 
-٣‏ ما هي قيم الدَّعم والثقة والرفع للقاعدة التالية؟ 
Wine, Canned Veg —» Frozen Meal‏ 

:KNIME (knime.org) jJall à»5zàa / في هذه المهمةء ستستخدم أداة تعدين البيانات المجانية‎ -٦ 
وذلك لإنشاء نماذج تنبؤية بلجموعة بيانات تحليل حركات العملاء الصغيرة نسبيًا. يجب‎ 
عليك تحليل مجموعة البيانات المعطاة (حول سلوك استبقاء / تسرب العميل لعينة مكونة‎ 
عميل) بغرض تطوير ومقارنة ما لا يقل عن ثلاثة ماذج للتنبؤ (أيّ: للتصنيف).‎ ٠٠٠١ من‎ 
فعلى سبيل المثال: يممكنك تضمين مقارنتك على أشجار القرار والشبكات العصبية وآلة ا متجهات‎ 
الداعمة والجار الأقرب و / أو نماذج الانحدار اللوجستي. فيما يلي تفاصيل هذه المهمة:‎ 
knime.org) ja KNIME جalنرڊ تثبيٽ واستخدام أداة‎ - 

- يمكنك أيضًا استخدام ۴×۲1 1S‏ لتجهيز البيانات مسبقًا (حسب حاجتك / رغبتك). 

- قم بتنزيل ملف البيانات 0115]0116101211511102]8.659) من موقع الكتاب على الويب. 

- يتم إعطاء البيانات بتنسيق 0517© (قيم مفصولة بفواصل). وهذا التنسيق هو تنسيق 
الملفات المسطحة الأكثر شيوعًا والذي تمْكن للعديد من أدوات البرنامج فتحه / التعامل 
معه بسهولة )ا في ذلك „(MS Excel KNIME‏ 

- اعرض نتائجك في مستند احترافي منظم جيدًا. 

- اعرض على صفحة الغلاف معلومات مناسبة عنك وعن المهمة. 


ew‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية dalos :)١(‏ وطرق» وخوارزميات التنقيب في البيانات 


- تكد من تكامل الأرقام (ابمخططات البيانيةء الرسوم البيانيةء الجداولء لقطات الشاشة) 
بشكل رائع في لوصف التَّصي بطريقة احترافية. كما يجب أن يحتوي التقرير على ستة 
CRISP-DM Jl, 4423) à) eLasl‏ 

- حاول ألا تتجاوز ٠١‏ صفحة ف الإجماليء ما في ذلك الغلاف (استخدم الخط 
ez Times New Roman‏ ۲ وتباعد الأسطر (Vo‏ 


مهامٌ الفريق ومشروعات لعب الأدوار: 

-١‏ قم بفحص كيفية قيام أجهزة التقاط البيانات الجديدة: مثل علامات 181717 بمساعدة 
المؤسسات على تحديد عملائها بدقة وتقسيمهم إلى أنشطة. مثل التسويق المستهدّف. تنطوي 
العديدٌ من هذه التطبيقات على التنقيب في البيانات. قم بإدخال المطبوعات والويب إلى 
الشاشة باستخداعم ا ماسح الضوني (502261): ثم قم باقتراح خمسة تطبيقات محتملة جديدة 
للتنقيب في البيانات يمكنها استخدام البيانات التي تم إنشاؤها باستخدام تقنية RFID‏ 
ما هي القضايا التي يمكن أن تنشأ إذا كانت قوانين البلد تتطلب تضمين هذه الأجهزة في جسم 
plà gard JS‏ تحديد الهوية الوطني؟ 

1- قم بمقابلة المسؤولين في كليتك أو المسؤولين التنفيذيين في مؤسستك؛ لتحديد كيف يمكن أن 
يساعدهم التنقيب في البيانات ومستودعات البيانات وأدوات 01,48 وأدوات التصوير في 
عملهم. اكتب اقتراحًا يَصف نتائجك. ثم قم بإعداد تقرير يتضمّن تقديرات التكلفة والفوائد. 

- يتوفر مستودع جيد جدًا للبيانات التي تمّ استخدامها لاختبار أداء العديد من خوارزميات 
التنقيب في البيانات ( ics. uci.edu/mlearn/MLRepository.html‏ 3445( پعض مجموعات 
البيانات إلى اختبار حدود الخوارزميات الحديثة لتعلّم الآلة. وكذلك تهدف إلى مقارنة أدائها 
مع الأساليب الجديدة للتعلم. ومع ذلك؛ قد تكون بعض مجموعات البيانات الأصغر مفيدةً في 
استكشاف وظائف أي برنامج من برامج التنقيب في البيانات, .KNIME 5| RapidMiner |J‏ 
قم بتنزيل مجموعة بيانات واحدة على الأقل من هذا المستودع (ولتكن: قواعد بيانات فحص 
الائتمان أو قاعدة بيانات الإسكان) وتطبيق أساليب شجرة القرار أو طرق التجميع حسب 
الاقتضاء. قم بإعداد تقرير بناءً على نتائجك. (يمكن استخدام بعض هذه التمارين» خاصةً تلك 
التي تنطوي على بيانات كبيرة أو مشكلات صعبة كمشاريع على المدى الطويل). 

-٤‏ يتم توفير مجموعات بيانات كبيرة Olh utg‏ من قبل الحكومة الأمريكية أو الشركات 
التابعة لها على الإنترنت. فعلى سبيل المثال: يمكنك الاطلاع على مجموعة كبيرة من 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ew‏ 





gil! الفصل‎ 


مجموعات البيانات الحكومية (02]2.809): ومجموعات بيانات مراكز السيطرة على الأمراض 
oll OLLI åegaxog Al hlg (www.cdc.gov/DataStatistics) lis lë g)lg‏ بعلم 
الأو بئة والنتائج النهائية الخاصة بشركة «Cancer.org (http://seer.cancer.gov/data)‏ 
ومجموعات بيانات نظام تقارير تحليلات www.nhtsa.) Jl 85155) oLJI SLs Jas‏ 
5 الاحظ أيضًَا أنه لا يتم عمل معالجة مُسبّقة لهذه المجموعات من البيانات 
لأغراض التنقيب ف البيانات؛ مما يجعلها موردًا رائعًا لتجربة عملية التنقيب في البيانات 
بالكامل. يتم إدراج مصدر آخر غني ممجموعة من مجموعات بيانات التحليلات على موقع 
-KDnuggets.com (kdnuggets.com/datasets/index.html)‏ 


ه- خذ بعين الاعتبار مجموعة البيانات التالية» والتي تتضمّن ثلاث سمات وتصنيقًا لقرارات 


€ 


القبول في برنامج ماجستير إدارة الأعمال: 

-١‏ باستخدام البيانات المعروضة في الجدول أدناه؛ قم بتطوير قواعد الخبرة اليدوية الخاصة 
بك لاتخاذ القرار. 

؟- استخدم مؤشر 6121 لإنشاء شجرة قرار. يمكنك استخدام الحسابات اليدوية أو جدول 
البيانات أدناه لإجراء الحسابات الأساسية. 

- استخدام برنامج شجرة قرارات آلي لإنشاء شجرة لنفس البيانات. 














mm GA Ue J M قرار النقاط‎ 
(بالنسبة المتوية)‎ 

10. Y,Vo Yo لا‎ 
ذلك‎ Y,0- V. y 
LN yo. vo نعم‎ 
to. DAT ^ y 
Ve Y,vo q. نعم‎ 
o4. Yo. M نعم‎ 
[zm FAO £o لا‎ 
aes "o. Vo نعم‎ 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
































التحليلات التنبؤية dalos :)١(‏ وطرق» وخوارزميات التنقيب في البيانات 














GMAT النقاط الكمية د‎ 
GMAT GPA T قرار‎ 
(isl (بالنسبة‎ 
ot. Y» "s s 
14۰ A0 A. 3 
£4- £e 10 s 





تمارين الإنترنت: 

8,2 —À bil Joe öl .cs.ualberta.ca/aixplore 3 AI Exploratorium 8j L5 5» e—8 -Y 
القرارات. اقرا السرد على إحصائيات لعبة كرة السّلة. افحص البيانات» ثم أنشئ شجرة‎ 
قرار. اكتب تقريرًا عن انطباعاتك عن دقة شجرة القرارات هذه. استكشف أيضًا تأثيرات‎ 
الخوارزميات المختلفة.‎ 

.egain.com fico.com ja s jal باستقصاء بعض أدوات التنقيب في البيانات ومورّديها.‎ -Y 
قم بزيارة موقع 11210161:071. وحَدَّد بعض منتجات التنقيب في البيانات ومقدّمي‎ 
الخدمات غير المذكورة في هذا الفصل.‎ 

- ابحث عن حالات حديثة من تطبيقات التنقيب في البيانات الناجحة. قم بزيارة مواقع الويب 
لبعض مورّدي أدوات التنقيب في البيانات» وابحث عن حالات أو قصص نجاح. ثم قم بإعداد 
تقرير يُلخّْص خمس دراسات حالة جديدة. 

-Teradatas انتقل إلى مواقع الويب الخاصة بالبائعين (خاصةً 545 و5255 و5ممع00).‎ -٤ 
واطلع على قصص النجاح الخاصة بأدوات ذكاء الأعمال‎ )۴i s29 Stato 
في البيانات). ما الذي تشترك فيه قصص النجاح المختلفة؟ كيف تختلف؟‎ älg OLAP) 

0- انتقل إلى 5]8]5011.0122 (وهي إحدى شركات 10611 الآن). قم بتنزيل ثلاث ورقات بيضاء 
على الأقل حول التطبيقات. أيّ من هذه التطبيقات رها استخدم تقنيات تعدين البيانات / 
النصوص / الويب التي تمت مناقشتها في هذا الفصل؟ 

-Y‏ اذهب إلى 55.6012 وقم بتنزيل ثلاث وثائق بيضاء على الأقل حول التطبيقات. f‏ من هذه التطبيقات 
رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي تمت مناقشتها في هذا الفصل؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري f10‏ 

















الفصل الرابع 


۷- انتقل إلى 2دم».55م5 (شركة 181/1). قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. 
أيٌّ من هذه التطبيقات ربما استخدم تقنيات تعدين البيانات / النصوص / الويب التي تمت 
مناقشتها في هذا الفصل؟ 

Jo eS .teradata.com (JI Jil -A‏ ثلاث ورقات بيضاء على الأقل حول التطبيقات. أي من 
هذه التطبيقات ربما استخدم تقنيات تعدين البيانات / النصوص / الويب التي تمت مناقشتها 
في هذا الفصل؟ 

9- انتقل إلى <زهء.660. قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. أيّ من هذه 
التطبيقات رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي تمت مناقشتها في 
هذا الفصل؟ 

o 3:5 eS .salfordsystems.com [I Jal -V-‏ ثلاث ورقات بيضاء على الأقل حول التطبيقات. 
أي من هذه التطبيقات ربما استخدم تقنيات تعدين البيانات / النصوص / الويب التي منت 
مناقشتها في هذا الفصل؟ 

.rulequest.com JJ] J 3l -M‏ قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. 
(Sl‏ من هذه التطبيقات ربما استخدم تقنيات تعدين البيانات / النصوص / الويب التي تت 
مناقشتها في هذا الفصل؟ 

-١1‏ انتقل إلى 5.6012]ع10188. استكشف الأقسام على التطبيقات وكذلك البرامج. ابحث عن 
أسماء ثلاث حزم إضافية على الأقل للتنقيب في البيانات وتنقيح النصوص. 


£M‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية ellas (V)‏ وطرق» وخوارزميات التنقيب في البيانات 


المراجع: 

- Abbott, D. (2014). Applied predictive analytics: Principles and techniques for the professional data 
analyst. John Wiley & Sons. 

- Anthes, G. H. (1999). "The next decade: interview with Arno A. Penzias; Computerworld, 33(1), pp. 3-4. 


- Chan, P. K., Phan, W., Prodromidis, A., & Stolfo, S. (1999). Distributed data mining in credit card fraud 
detection. IEEE Intelligent Systems, 14(6), 67-74. 


- CRISP-DM. (2013). Cross-Industry Standard Process for Data Mining (CRISP-DM). http://crisp-dm. 
orgwww.the-modeling-agency.com/crisp-dm.pdf (accessed February 2, 2013). 

- Davenport, T. H. (2006, January). Competing on analytics. Harvard Business Review, 99-107. 

- Delen, D. (2009). Analysis of cancer data: A data mining approach. Expert Systems, 26(1), 100-112. 


- Delen, D. (2014). Real-world data mining: Applied business analytics and decision making. Upper 
Saddle River, NJ: Pearson. 


- Delen, D., Cogdell, D., & Kasap, N. (2012). A comparative analysis of data mining methods in predicting 
NCAA Bowl outcomes. International Journal of Forecasting, 28, 543-552. 


- Delen, D., & Sharda, R. (2010). Predicting the financial success of Hollywood movies using an 
information fusion approach. Industrial Engineering Journal, 21(1), 30-37. Delen, D., Sharda, R., & 
Kumar, P. (2007). Movie forecast Guru: A Web-based DSS for Hollywood managers. Decision Support 
Systems, 43(4), 1151-1170. 


- Delen, D., Walker, G., & Kadam, A. (2005). Predicting breast cancer survivability: A comparison of 
three data mining methods. Artificial Intelligence in Medicine, 34(2), 113-127. 


- Dunham, M. (2003). Data mining: Introductory and advanced topics. Upper Saddle River, NJ: Prentice Hall. 


- Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From knowledge discovery in databases. AI 
Magazine, 17(3), 37-54. 


- Hoffman, T. (1998, December 7). Banks turn to IT to reclaim most profitable customers. Computerworld. 
- Hoffman, T. (1999, April 19). Insurers mine for age-appropriate offering. Computerworld. 


- Kohonen, T. (1982). Self-organized formation of topologically correct feature maps. Biological 
Cybernetics, 43(1), 59-69. 


- Nemati, H. R., & Barko, C. D. (2001). Issues in organizational data mining: A survey of current 
practices. Journal of Data Warehousing, 6(1), 25-36. 


- Nisbet, R., Miner, G., & Elder IV, J. (2009). “Top 10 Data Mining Mistakes” in the Handbook of 
statistical analysis and data mining applications. pp. 733-754. Academic Press. 


- Quinlan, J. R. (1986). Induction of decision trees. Machine Learning, 1, 81-106. 


- SEMMA. (2009). SAS's data mining process: Sample, explore, modify, model, assess.sas.com/offices/ 
europe/uk/technologies/analytics/datamining/miner/semma.html (accessed August 2009). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري EV‏ 


الفصل الرابع 


- Seni, G., & Elder, J. F. (2010). Ensemble methods in data mining: Improving accuracy through 
combining predictions. Synthesis Lectures on Data Mining and Knowledge Discovery, 2(1), 1-126. 


- Sharda, R., & Delen, D. (2006). Predicting box-office success of motion pictures with neural networks. 
Expert Systems with Applications, 30, 243-254. 


- Shultz, R. (2004, December 7). Live from NCDM: Tales of database buffoonery. directmag.com/news/ 
ncdm-12-07- 04/index.html (accessed April 2009). 


- Skalak, D. (2001). Data mining blunders exposed! DB2 Magazine, 6(2), 10-13. 


- Thongkam, J., Xu, G., Zhang, Y., & Huang, F. (2009). Toward breast cancer survivability prediction 
models through improving training space. Expert Systems with Applications, 36(10), 12200-12209. 


- Wald, M. L. (2004, February 21). U.S. calls release of JetBlue data improper. The New York Times. 


- Wright, C. (2012). Statistical predictors of March Madness: An examination of the NCAA Men's 
Basketball ^ Championship. http://economics-files.pomona.edu/GarySmith/Econ190/Wright%20 
March?620Madness?620Final?620Paper.pdf (accessed February 2, 2013). 


- Zaima, A. (2003). The five myths of data mining. What Works: Best practices in business intelligence 
and data warehousing, Vol. 15. Chatsworth, CA: The Data Warehousing Institute, pp. 42-43. 


- Zolbanin, H. M., Delen, D., & Zadeh, A. H. (2015). Predicting overall survivability in comorbidity of 
cancers: A data mining approach. Decision Support Systems, 74, 150-161. 


EA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل الخامس 
التحليلات التنبؤية (؟) 
فيلات النض والويب ووسائل التواضل الاجتماعي 


أهداف التعلم: 
- وصف تحليلات النصوص وفهم الحاجة إلى التنقيب في النص. 
- التمييز بين تحليلات النصوصء والتنقيب في النصء والتنقيب في البيانات. 
- فهم المجالات المتنوعة لتطبيق التنقيب في النص. 
- التعرف على عملية تنفيذ مشروع التنقيب في النص. 
- التعرف على الطرق المختلفة لهيكلة البيانات النصية. 
- وصف تحليل ال مشاعر. 
- رفع مستوى الإلمام بالتطبيقات الشائعة لتحليل المشاعر. 
- تعلم الطرق الشائعة لتحليل المشاعر. 
- التمرس على تحليلات الكلام كما ترتبط بتحليل المشاعر. 

يقدم هذا الفصل نظرةً شاملة على تحليلات / التنقيب في النصوص / الويبء بالإضافة إلى 
مجالات التطبيق الشائعة مثل محركات البحث وتحليل ال مشاعر وتحليلات الشبكات / وسائل 
التواصل الاجتماعي. وكما شهدنا في السنوات الأخيرة» فإن البيانات غير المهيكلة التي يتم إنشاؤها 
عبر الإنترنت (الويب» وشبكات الاستشعارء وأنظمة التعرف على [RFID] goll olas‏ 
وشبكات المراقبةء إلخ) تزداد بسرعة هائلة وليس هناك مؤشر على تباطئها. تجبر هذه الطبيعة 
المتغيرة للبيانات المنظمات على جعل تحليلات النص والويب جزءًا حساسًا من بنيتها التحتية فيما 
يخص ذكاء / تحليلات الأعمال. 


١-0‏ مقال افتتاحي: الآلة مقابل الإنسان على إ4:هم7160: قصة واتسون: 


هل تستطيع الآلة التغلب على أفضل ما في الإنسان فيما يفترض أن يكون الإنسان هو الأفضل 
فيه؟ يبدو أن الإجابة هي: نعم واسم الآلة هو واتسون. حيث يعتبر واتسون هو نظام حاسب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۹ 


الفصل الخامس 


Us al‏ (مزيج جديد من الأجهزة والبرامج المتقدمة) مصمم للإجابة على الأسئلة المطروحة 
باللغة البشرية الطبيعية. وقد تم تطويره في عام ١٠٠١‏ من قبل فريق IBM Research‏ 525« 
من مشروع 4ط واستمد اسمه من أول رئيس لٿركة 18M‏ وو .Thomas J. Watson‏ 


là 


منذ ما یقرب من ۳ سنواتء كانت 1165653 181/1 تبحث عن تحد بحثيّ كبير لمجاراة 
الاهتمامات العلمية والشعبية Deep Blue J‏ بطل لعبة الشطرنج على الحاسب. والذي قد 
يرتبط بعلاقة واضحة بالاهتمامات التجارية الخاصة بشركة 1821. كان الهدف هو تطوير علوم 
الحاسب من خلال استكشاف طرق جديدة لتقنية الحاسب تؤثر على العلوم والأعمال التجارية 
والمجتمع. وبناءً على ذلكء de wèl of Sg cwl pll; cliu Guss IBM Research CLS‏ 
لقب بطل العالم بشكل فوري لبرنامج مسابقة التليفزيون الأمريي إ314م160! وقد شمل نطاق 
التحدي مشاركة متسابق آلي بشكل فوري للعرض التليفزيوني» ويكون لديه القدرة على الاستماع 
والفهم والاستجابة» وليس مجرد تمرين معملي. 
التنافس ضد الأفضل: 

في عام ٠١٠١‏ وكاختبار لقدراته» تنافس واتسون على مسابقة Jeopardy‏ في أول مباراة بين 
البشر والآلة. في مباراة ثنائية مجمعة النقاط (تم بثها عبر ثلاث حلقات من العرض التلفازي 
à Jeopardy‏ الفترة 11-١‏ فبراير)» فاز واتسون على ۸)٥۲‏ 844 أكبر رابح بالمال على الإطلاق في 
Ken Jennings Ls Jeopardy‏ حامل الرقم القياسي لأطول فترة بالبطولة وهي (0/ يومًا). في 
هذه الحلقات» استمر واتسون في التفوق على خصومه من البشر وفقًا لجهاز إشارات اللعبة. لكنه 
واجه صعوبة في الرد على بعض الفئات. خاصةً أولئك الذين لديهم أدلة قصيرة تحتوي فقط على بضع 
كلمات. استطاع واتسون الوصول إلى ٠٠١‏ مليون صفحة منظمة / غير منظمة المحتوى ومخزنة على 
£ تيرابايت من إجمالي السعة التخزينية للقرص. وم يكن واتسون متصلًا بالإنترنت خلال المباراة. 

أعلن أحد ال مختصين في لقاء تلفازي عن 1200314 أن التحدي المطلوب هو التقدم ودمج 
مجموعة متنوعة من تقنيات ضمان الجودة (التنقيب في النصوص ومعالجة اللغات الطبيعية)» 
ها في ذلك التحليل اللفظي» وتصنيف الأسئلة وتحليلها واقتناء المصادر بصورة تلقائية وتقييمها. 
واكتشاف الكيان والعلاقةء وتكوين النماذج المنطقية» وتمثيل المعرفة والتفكير. وأضاف أن الفوز 
في 1200854 يتطلب أن تتحلى إجاباتك بثقة في الحوسبة بصورة عالية الدقة. وفي الوقت الذي 
تكتسي فيه الأسئلة وا محتوى بالغموض والضجيج ولا يتمتع أي من الخوارزميات الفردية بالكمال. 


tye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


لذلك؛ يجب أن يقدم كل مكون مخرجاته بدرجة من الثقة» كما يجب تجميع درجات الثقة لكل 
المكونات الفردية للقيام بحساب الثقة الكلية للإجابة النهائية. ويتم استخدام الثقة النهائية 
لتحديد ما إذا كان ينبغي على نظام الحاسب المخاطرة باختيار الإجابة على أي حال. في لغة برنامج 
Jeopardy‏ تستخدم هذه الثقة لتحديد ما إذا كان الحاسب سوف يصدر ”رنيئًا“ أو ”طنيئًا“ لسؤال 
ما. وهنا يجب أن يتم حساب الثقة خلال الوقت الذي تتم فيه قراءة السؤال وقبل فرصة صدور 
الرنين للسؤال. ويقدر هذا الوقت تقريبًا ما بين ثانية واحدة إلى 1 ثوان بمتوسط ١‏ ثوانٍ تقريبًا. 
كيف يفعل واتسون ذلك؟ 
إن نظام واتسون» والذي يدعى 000۸ هو بنية حسابية متوازية وواسعة النطاق تركز 
على التنقيب في النصوصء وتستند إلى الأدلة الاحتمالية. وبالنسبة لتحدي exl Jeopardy‏ 
واتسون أكثر من ٠٠١‏ طريقة مختلفة لتحليل اللغة الطبيعية. وتحديد المصادرء وإيجاد وتوليد 
فرضيات» وإيجاد الأدلة وإعطائها نقاطء ودمج وترتيب الفرضيات. وما هو أهم بكثير من أي 
تقنية تم استخدامها هو كيفية دمجهم في 0٠0۸4‏ بحيث هكن للطرق المتداخلة أن تستحضر 
نقاط قوّتها للإنتاج والمساهمة في تحسين JS‏ من الدقة والثقة والسرعة. 
تعتبر 1066504 بنية ذات منهجية مصاحبة» وهي ليست خاصة بتحدي (810م140. وتشكل 
المبادئ الشاملة في 1266004 توازيًا هائلًاه وعديدًا من الخبراء» وتقديرًا للثقة المنتشرة» وتكاملًا 
في تحليلات النص بصورة أحدث وأعظم. 
- التوازي الهائل: يفيد التوازي الهائل في النظر في تفسيرات وفرضيات متعددة. 
- العديد من الخبراء: يسهل التكامل والتطبيق والتقييم السياقي لمجموعة واسعة من تحليلات 
الأسئلة والمحتوى الاحتمالي المتباعدين عن بعضهما. 
- تقدير الثقة المنتشرة: لا يلتزم أي عنصر بأي إجابة؛ فجميع المكونات تنتج ميزات ومستوى الثقة 
المرتبطة بهاء وسجل تفسيرات مختلفة للأسئلة والمحتوى. حيث تقوم الركيزة الأساسية لمعالجة 
الثقة بالتعرف على كيفية تكديس النتائج ودمجها. 
- تكامل المعرفة السطحية والعميقة: ويتم ذلك عن طريق الموازنة في استخدام الدلالات الصارمة 
والسطحيةء والاستفادة من العديد من التجميعات التي تكونت بشكل يتسم بالأريحية. 
يوضح الشكل )١-0(‏ بنية عالية المستوى ل 04م1(66. ولمزيد من التفاصيل الفنية حول 
المكونات المختلفة لهذه البنية وأدوارها وقدراتها امحددة انظر: ۴۲۲٤i‏ وآخرین (۲۰۱۰). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £v!‏ 


الفصل الخامس 


Ganan) 


i 





2 m 
+---[ترجمة إلى رقي)‎ rem ewn المج وترتيب‎ 
الإجابة‎ 
x, 
DeepQA تصوير عالي المستوى لبنية‎ :١-6 شكل‎ 
استنتاج:‎ 


1066004 شركة 18۷ في جمع المتطلبات التي أدت إلى تصميم بنية‎ Jeopardy $425 aeL, 
وتنفيذ برنامج واتسون. وبعد 7 سنوات من البحث والتطوير المكثف من قبل فريق أساسي‎ 
على مستويات‎ Jeopardy باحنّاه يعمل واتسون في العرض التلفازي لمسابقة‎ ٠١ يتكون تقريبًا من‎ 
عالية من الخبرة البشرية من حيث الدقة والثقة والسرعة.‎ 

تزعم 1831 أنها طورت العديد من الخوارزميات الحسابية واللغوية لمعالجة أنواع مختلفة 
من القضايا والمتطلبات فيما يخص ضمان الجودة. وعلى الرغم من أن بواطن هذه الخوارزميات 
غير معروفةء إلا أنها حققت أقصى استفادة من تحليلات النص والتنقيب في النص. وتعمل شركة 
4 الآن على إصدار واتسون للتعامل مع المشكلات التي يمكن التغلب عليها في مجال الرعاية 
الصحية والطب (27610:282 وآخرون: (Y-Y‏ 
ماذا يمكننا أن نتعلم من هذه المقالة القصيرة: 

مما لا شك فيه أن تقنية الحاسب - سواء الأجهزة أو واجهات البرامج - تتقدم بشكل أسرع 
من أي شيء آخر في الخمسين سن الماضية. إن الأشياء التي كانت كبيرة جدًّا ومعقدة جدًا ومن 
ا مستحيل حلهاء أصبحت الآن في متناول تقنية المعلومات. وتعتبر تحليلات / التنقيب في النص 
إحدى التقنيات التمكينية المستخدة في ذلك. وقد تم إنشاء قواعد بيانات لتركيب البيانات 
بحيث يمكن معالجتها بواسطة أجهزة الحاسب. من ناحية أخرىء كان المقصود بالنسبة للنص أن 
تتم معالجته بواسطة البشر. والسؤال الذي يطرح نفسه هناء هل يمكن للآلات القيام بالأشياء 
التي تتطلب إبداع الإنسان وذكاءه» وهي مم تصمم أصل للآلات؟ من الواضح أن الإجابة: نعم. 


ery‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


فيعتبر واتسون مثالًا رائعًا على المسافة التى قطعناها في معالجة المستحيل. وقد أصبحت أجهزة 
الحاسب الآن ذكية بما يكفي للقيام بدور البشر فيما نعتقد أن البشر هم الأفضل في هذا المجال. 
إن فهم السؤال الذي تم طرحه في اللغة البشرية المنطوقة» ومعالجته وفهمه فهمًا جيدًاء والبحث 
عن إجابة له والرد عليه في غضون ثوانٍ قليلة كان شيئًا لم يكن بإمكاننا تصوره قبل أن يفعله 
واتسون فعلًا. وفي هذا الفصلء ستتعلم الأدوات والتقنيات التي قام عليها واتسون والعديد من 
الأجهزة الذكية الأخرى والتي صنعت المعجزات من أجل معالجة المشاكل التي كان يُعتقد في يوم 
من الأيام أنه من المستحيل حلها. 

أسئلة مراجعة على المقالة الافتتاحية: 

1- ما هو واتسون؟ ما هو المميز $43 

-V‏ ما هي التقنيات المستخدمة في بناء واتسون (سواء من الأجهزة أو من البرامج)؟ 

8 ما هي الخصائص المبتكرة لبنية 1766004 التي صنعت تفوق واتسون؟ 

ISU -4‏ أنفقت 18316 كل هذا الوقت وامال لبناء واتسون؟ أين عائد الاستثمار (8©01)؟ 


0-؟ نظرة عامّة على تحليلات النص والتنقيب في النص: 

يتميز عصر المعلومات الذي نعيش فيه بالنمو السريع في كمية البيانات والمعلومات التي 
يتم جمعها وتخزينها وإتاحتها في شكل إلكتروني. حيث يتم تخزين الغالبية العظمى من بيانات 
الأعمال في وثائق نصية غير منظمة فعليًا. ووفقًا لدراسة أجراها كل Merrill Lynch ġ—‏ 
XAO olè Gartners‏ من جميع بيانات الشركة يتم التقاطها وتخزينها في شكل غير منظم 
.(McKnight, 2005)‏ وقد ذكرت نفس الدراسة أيضًا أن هذه البيانات غير المنظمة يتضاعف 
حجمها كل 16 شهرًا. ونظرًا لأن المعرفة تمثل قوة في عاط الأعمال اليوم: بالإضافة إلى أنها مستمدة 
من البيانات والمعلومات» فإن الشركات التى تستفيد بكفاءة وبشكل فعال من مصادر البيانات 
النصية يكون لديها المعرفة اللازمة لاتخاذ قرارات أفضلء مما يجعلها تتميز في المنافسة عن تلك 
الشركات التي تتخلف عن الركب. وهذا تماما هو المكان الذي تتناسب فيه الحاجة إلى تحليلات 
النصوص والتنقيب في النص مع الصورة الكبيرة الحالية للأعمال التجارية. 

وعلى الرغم من أن الهدف الرئيس لكل من تحليلات النصوص والتنقيب في النص هو تحويل 
البيانات النصية غير المهيكلة إلى معلومات قابلة للتطبيق من خلال تطبيق معالجة اللغات الطبيعية 
(2115) والتحليلات. حيث إن تعريفاتها مختلفة بعض الشيء, على الأقل بالنسبة لبعض خبراء هذا 
المجال. ووفقًا لهؤلاء الخبراء» فإن مفهوم تحليلات النص هو مفهوم أوسع حيث يشمل استرجاع 
المعلومات (مثل البحث وتحديد الوثائق ذات الصلة لمجموعة معينة من المصطلحات الرئيسة). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري err‏ 


الفصل الخامس 


وكذلك استخراج المعلومات» والتنقيب في البيانات» والتنقيب à‏ الويب» في حين يركز التنقيب à‏ 
النص في المقام الأول على اكتشاف معرفة جديدة ومفيدة من مصادر البيانات النصية. ويوضح 
الشكل (0-؟) العلاقات بين تحليلات النصوص والتنقيب في النص إلى جانب مناطق التطبيق الأخرى 
ذات الصلة. ويبين الجزء السفلي من الشكل (5-؟) التخصصات الرئيسة (أساس التصميم) التي 
تلعب دورًا حساسًا في تطوير مجالات التطبيق الأكثر انتشارًا بشكل متزايد. وبناءً على هذا التعريف 
لتحليل النصوصء والتنقيب في النصء فإنه يمكن ببساطة حساب الفرق بينهما كما يلي: 

تحليلات النص - استرجاع المعلومات + استخراج المعلومات + التنقيب في البيانات + التنقيب في الويب. 

أو ببساطة: تحليلات النص - استرجاع المعلومات + التنقيب في النص. 








شكل 7-0: تحليلات النص والتطبيقات المرتبطة والتخصصات التمكينية 


Sources: Ferrucci, D., Brown, E., Chu-Carroll, J., Fan, J., Gondek, D., Kalyanpur, A. A.,... Welty, C. (2010). 
Building Watson: An overview of the DeepQA Project. AI Magazine, 31(3); DeepQA. DeepQA Project: 
FAQ, IBM Corporation (2011). research.ibm.com/deepqa/faq.shtml (accessed January 2013); Feldman, 
S., Hanover, J., Burghard, C., & Schubmehl, D. (2012). Unlocking the power of unstructured data. IBM 
white paper www-Ül.ibm.com/software/ebusiness/jstart/downloads/unlockingUnstructuredData.pdf 
(accessed February 2013). 


eré‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


ويُعد مصطلح تحليلات النصوص مصطاحًا جديدًا نسبيًا بالمقارنة مع مصطلح التنقيب في 
النص؛ إذ يركز مصطلح تحليلات النصوص على التحليلات: وكما هو الحال في العديد من مجالات 
تطبيقات التقنية الأخرى ذات الصلة (مثل تحليلات المستهلك. والتحليلات الكاملة, والتحليلات 
ا مرئيةء والتحليلات الاجتماعية)» فإن مجال النص يحتاج أيضًا إلى الحصول على مُحاكاة للتحليلات. 
وعلى الرغم من استخدام مصطلح تحليلات النصوص بشكل أكثر انتشارًا في سياق تطبيق الأعمالء 
إلا أن مصطلح التنقيب في النص يستخدم بشكل متكرر في دوائر البحث الأكاديمية. ورغم أنه 
في بعض الأحيان قد يتم تعريف مصطلحي (تحليلات النص والتنقيب في النص) بطريقة مختلفة 
بعض الشيء. إلا أنهما يستخدمان بشكل مترادف. 

التنقيب في النص (ويُعرف أيضًا باسم التنقيب في البيانات النصية» أو اكتشاف المعرفة في قواعد 
البيانات النصية) هو عملية شبه آلية لاستخلاص الأنماط (المعلومات والمعرفة المفيدة) من كميات 
كبيرة من مصادر البيانات غير المُهيكلة. والجدير بالذكر أن التنقيب في البيانات هو عملية تحديد 
أنماط صالحة ومبتكرة ومفيدة ومفهومة في بيانات مخزنة في قواعد البيانات المنظمة» حيث يتم 
تنظيم البيانات في سجلات منظمة من خلال متغيرات فئوية أو ترتيبية أو مستمرة. ويُعد التنقيب في 
النص هو نفسه التنقيب ف البيانات من حيث استهدافه لنفس الغرض واستخدامه لنفس العمليات» 
ولكن مع التنقيب في النص ينطوي الإدخال إلى العملية على مجموعة من ملفات البيانات غير 
المهيكلة Word (3565 : Js (L3 J8VI sl)‏ وملفات 2017 والمقتبسات النصية وملفات .200/1 
وما إلى ذلك. ويمكن اعتبار التنقيب في النص في جوهره كعملية (ذات خطوتين رئيسيتين) تبدأ بفرض 
هيكلة مصادر البيانات المستندة إلى النص يتبعها استخلاص المعلومات والمعارف ذات الصلة من 
هذه البيانات المهيكلة والمستندة إلى النصء وذلك باستخدام تقنيات وأدوات التنقيب في البيانات. 


وتظهر فوائد التنقيب في النص بوضوح في المجالات التي يتم فيها توليد كميات كبيرة من 
البيانات النصية» مثل القانون (أوامر المحكمة). والبحوث الأكادممية (المقالات البحثية)» والتمويل 
(تقارير فصلية)» بالإضافة إلى الطب (ملخصات التفريخ)» وعلم الأحياء (التفاعلات الجزئية)» 
والتقنية (ملفات براءات الاختراع)» فضلاً عن التسويق (تعليقات العملاء). فعلى سبيل «JUL‏ 
يمكن استخدام التفاعلات النصية القائمة على النموذج الحر مع العملاء في شكل شكاوى (أو 
مدح) ومطالبات الضمان من أجل تحديد خصائص المنتجات والخدمات التي تعتبر أقل من مثالية 
بشكل موضوعيء ويمكن استخدامها كمدخلات لتطوير منتجات أفضل ومخصصات الخدمة. 
وبالمثل» فإن برامج التوعية السوقية ومجموعات التركيز تولد كميات كبيرة من البيانات. ويمكن 
للعملاء تقديم أفكارهم حول منتجات وخدمات الشركة بأسلوبهم الخاصء وذلك من خلال عدم 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري tyo‏ 


الفصل الخامس 


تقيبد التعليقات على ال منتجات أو الخدمات أو جعلها مقننة. ومن المجالات الأخرى التى أثرت 

فيها المعالجة الآلية للنص غير المنظم تأثيرا كبيرا مجال الاتصالات الإلكترونية والبريد الإلكتروني. 

والجدير بالذكر أن التنقيب في النص لا يُستخدم فقط لتصنيف وتصفية البريد الإلكتروني غير 

الهام» وإنما يمكن استخدامه أيضًا لتحديد أولويات البريد الإلكتروني تلقائيًا استنادًا إلى مستوى 

الأهمية بالإضافة إلى إنشاء ردود تلقائية (2004 ,ناذآ & .(Weng‏ ونذكر فيما يلي مجالات 

التطبيق الأكثر شيوعًا في التنقيب في النصوص: : 

- استخراج المعلومات: تحديد العبارات والعلاقات الرئيسة داخل النص من خلال البحث عن 
الكائنات والتسلسلات المحددة مسبقا في النص عن طريق مطابقة النمط. 

- تتبع الموضوع: استنادًا إلى ملف تعريف المُستَخدم بالإضافة إلى الوثائق التي تحتوي على 
eae ull Ji clas‏ فإن التنقيب في النص يمكنه التنبؤ بالوثائق الأخرى التي تهم المستخدم. 

- التلخيص: تلخيص الوثيقة توفيرًا للوقت من جانب القارئ. 

- التصنيف: تحديد الموضوعات الرئيسة للوثيقة ثم وضعها في مجموعة كبيرة محددة مسبقًا من 
الفئات بناءً على تلك الموضوعات. 

- التجميع: تجميع وثائق مشابهة بدون وجود مجموعة محددة مسبقًا من الفئات. 

- ربط مفهوم: ربط الوثائق ذات الصلة من خلال تحديد المفاهيم ا مشتركةء وبذلك يساعد المستخدمين 
في الوصول إلى المعلومات التي قد يصعب الوصول إليها باستخدام الطرق التقليدية. 

- إجابة السؤال: إيجاد أفضل إجابة لسؤال معين من خلال مطابقة النمط القائم على المعرفة. 

وللحصول على شرح لبعض المصطلحات وا مفاهيم المُستخدّمة في التنقيب في النص انظر رؤية 
فنية (1-0)» في حين توضح الحالة العملية )١1-0(‏ استخدام التنقيب في النص في صناعة التأمين. 


رؤية فنية ٠-١‏ 
مصطلحات التنقيب في النص 
توضح القائمة التالية بعض مصطلحات التنقيب في النص شائعة الاستخدام 
- بياقات غير مقيكلة (مقازل البئانات المهيكلة):' Lu‏ اللهيكلة صيغة مجذدة مسيقًا: 
وعادةً ما يتم تنظيمها في سجلات ذات قيم بيانات بسيطة (فئوية وترتيبية ومتغيرات 
مستمرة) ومخزنة في قواعد البيانات. وف المقابلء فإن البيانات غير المهيكلة لا تحتوي على 
صيغة محددة مسبقاً ويتم تخزينها في شكل وثائق نصية. وتستخدم أجهزة الحاسوب 


£vi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


البيانات المهيكلة في جوهرها للقيام بالمعالجة: في حين تُستخدم البيانات غير المهيكلة 
بواسطة البشر للمعالجة والفهم. 

- مجموعة القوانين ونام:00: (جمع 058م207) وتُعرف لغويًا بأنها مجموعة كبيرة ومنسقة من 
النصوص (التي عادةً ما يتم تخزينها ومعالجتها إلكترونيًا) تم إعدادها بغرض إجراء اكتشاف المعرفة. 

- المصطلحات: المصطلح هو عبارة عن كلمة واحدة أو عبارة متعددة الكلمات مستخرجة مباشرة 
من مجموعة قوانين خاصة بمجال معين عن طريق أساليب معالجة اللغات الطبيعية NLP‏ 

- المفاهيم: هي مواصفات يتم إنشاؤها من مجموعة من الوثائق عن طريق الوسائل 
اليدوية أو منهج تصنيف إحصافي أو قائم على القواعد أو مزيج ما بين كل ذلك. ومقارنة 
بالمصطلحات: تكون المفاهيم نتيجة لفكرة تجريدية على مستوى أعلى. 

:Stemming (liz Nl -‏ وهو عملية تقليل الكلمات المصرفة إلى أصلها (أو قاعدتها أو 
äär às OLS yS stemmer, stemming, stemmed JÈL Law de (lojio‏ 
من الأصل „stem gag‏ 

- كلمات التوقف: كلمات التوقف (أو كلمات الضجيج) وهي كلمات يتم تصفيتها قبل 
أو بعد معالجة بيانات اللغة الطبيعية (بمعنى النص). وعلى الرغم من عدم وجود 
قائمة مقبولة عالليًا لكلمات التوقفء فإن معظم أدوات معالجة اللغات الطبيعية 711.5 
تستخدم قائمة تتضمن «a, am, the, of)‏ إلخ)» والأفعال المساعدة ds, are, was, were)‏ 
إلخ)» والكلمات المتعلقة بالسياق والتي تعتبر غير مميزة. 

- ا مرادفات والمتجانسات: المرادفات هي كلمات مختلفة نحويًا (أي مختلفة هجائيًا) لكن 
ذات معان متماثلة أو على الأقل متشابهة (مثل السينما والأفلام والصور المتحركة). وفي 
المقابل» فإن المتجانسات. والتي تسمى أيضًا المشتركات اللفظية. هي كلمات متطابقة نحويًا 
(أي متشابهة تمامًا من الناحية الهجائية) لكنها ذات معانٍ مختلفة (فمثلًا. القوس يمكن أن 
يعني ”الانحناء إلى الأمام“» أو ”واجهة السفينة“» أو ”السلاح الذي يطلق السهام“» أو ”نوع 
من الأشرطة المربوطة“). 

- التدميز Tokenizing‏ الرمز هو عبارة نصية يتم تصنيفها في جملة وفقًا للوظيفة التي 
تؤديها. ويعرف هذا التصنيف بالترميز 12108ه6016. قد يبدو الرمز مثل أي شيء يحتاج 
أن يكون جزءًا نافكًا من النص ال مهيكل. 

- قاموس المصطلحات: وهو مجموعة من المصطلحات الخاصة بمجال محدد والتي يمكن 
استخدامها لحصر ال مصطلحات ال مستخرجة من داخل مجموعة القوانين (ودامم»). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري eV‏ 


الفصل الخامس 


- تكرار الكلمات: وهو عدد مرات العثور على كلمة ما في وثيقة ماء 

:Part-of-speech tagging BI oa sja) Olde gös -‏ وهو عملية وسم كلمات في 
النص كمطابقة لجزء معين من الكلام (مثل الأسماء والأفعال والصفات وظرف الحال والزمان 
Ola‏ وما إلى ذلك) بناءً على تعريف الكلمة والسياق الذي تستخدم فيه. 

- المورفولوجيا (10108م210: وهو فرع من علوم اللغة وجزء من معالجة اللغات الطبيعية (NLP)‏ 
والذي يدرس الهيكل الداخلي للكلمات (أنماط تنسيق الكلمة داخل لغة ما أو فيما بين عدة لغات). 

- مصفوفة ٤١۵٠ء‏ هل-رط- ء1 (مصفوفة الأحداث): وهي مخطط تمثيلي شائع للعلاقة 
القائمة على التكرار بين المصطلحات والوثائق في شكل جدول حيث يتم وضع المصطلحات في 
Gas‏ والوثائق في صفوف. ويكون التكرار بين المصطلحات والوثائق في الخلايا كقيم صحيحة. 

- فك القيمة المفرد (فهرسة دلالات الألفاظ غير المباشرة): وهي طريقة تخفيض الأبعاد وتستخدم 
لتحويل مصفوفة 61112626 7-00(-6]12] إلى حجم مقبول عن طريق توليد تمثيل متوسط للتكرارت 
باستخدام طريقة معالجة بارعة للمصفوفة وهي طريقة مشابهة لتحليل OUS‏ الأساسية. 

حالة عملية ١-0‏ 
مجموعة التأمين تعمل على تقوية إدارة ا مخاطر مع حل التنقيب في النص 
عندما تم طرح سؤال عن التحدي الأكبر الذي يواجه صناعة التأمين على السيارات 
التشيكية: م يتردد دكتور 601118[ :2616 رئيس فريق الخدمات الاكتوارية لمكتب 
التأمينات التشيكية (018) في التعبير عن ذلك بقوله: «تزداد مطالبات الإصابة الجسدية 
بشكل غير متناسب ylis‏ مطالبات تلف السيارة“. و18٥‏ هي منظمة مهنية لشركات 
التأمين في جمهورية التشيك والتي تتعامل مع المطالبات غير المؤمن عليها والدولية وغير 
المدونة ما يعرف باسم مسؤولية الطرف الثالث للسيارات. ويضيف Peter Jedlicka‏ 
”وتمثل تعويضات الإصابة الجسدية الآن حوالي >٤٥‏ من المطالبات المقدمة ضد أعضائناء 
وستستمر هذه النسبة في التزايد بسبب التغييرات التشريعية الأخيرة“. 
وتتمثل إحدى الصعوبات التي تطرحها مطالبات الإصابة الجسدية على شركات 

التأمين في صعوبة التنبؤ بحجم الضرر المباشر من جراء حادث سيارة؛ إذ تتفاقم بعض 
الإصابات مع الوقت والتي لم تكن بتلك الحدة وقت الحادثء كما أن الإصابات التي قد 
تبدو طفيفة يمكن أن تتحول إلى حالات مزمنة. وفي السابق كانت شركات التأمين تقدّر 
بدقة مسؤوليتها عن الأضرار الطبية» وبصورة أدق كانت تستطيع إدارة مخاطرها وتوحيد 
مواردهها. ومع ذلكء فإنه نظرًا لأن المعلومات المطلوبة موجودة في وثائق غير مهيكلة 


EYA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


مثل تقارير الحوادث وتصريحات الشهود. فإن الأمر يستغرق وقتًا طويلًا للغاية بالنسبة 
للموظفين الأفراد لإجراء التحليل اللازم. 

ولتوسيع وإجراء تحليل آلي لكلٍ من تقارير الحوادث غير المهيكلة» وعبارات الشهود 
وصيغ المطالبات» قامت 018 بنشر حل تحليل البيانات استنادًا على Dell gs JS‏ 
Statistica asā 5. 22. .Statistica Text Miner 314 4ls Statistica Data Miner‏ 
Data Miner‏ مجموعة آدوات بديهية وسهلة الاستخدام» بحيث يمكن الوصول إليها 
حتى من قبل غير المحللين. 

ويعمل الحل على قراءة وكتابة البيانات بشكل عملي من جميع التنسيقات ا معيارية 
للملف كما يعرض أدوات تنظيف بيانات قوية ومتطورة. كما أنه يدعم حتى المستخدمين 
المبتدئين باستخدام معالجات الاستعلام» والتي تُسمى وصفات التنقيب عن البيانات» 
والتي تساعدهم في الوصول إلى الإجابات التي يحتاجونها بشكل أسرع. 

ومع امتداد La Statistica rext Miner‏ المستخدمون إلى أدوات الاستخراج والاختيار 
اللازمة لفهرسة وتصنيف وتجميع ا معلومات من مجموعات كبيرة من البيانات النصية غير 
المهيكلة. مثل صيغ مطالبات التأمين. وبالإضافة إلى استخدام حل 518150168 لعمل تنبؤات 
حول مطالبات الأضرار الطبية المستقبلية. فيمكن استخدام 018 أيصًا لإيجاد الأماط التي 
تكشف محاولات الاحتيال أو لتحديد التحسينات المطلوبة للسلامة على الطريق. 

تحسينات في دقة تقديرات المسؤولية: 

ويتوقع esi» ol Jedlic'ka‏ حل 5]8]15]168 بتحسين قدرة 018 بشكل كبير على 
التنبؤ بالمطالبات الطبية الكلية التي قد تنشأ عن أي حادث؛ إذ يقول: ”إن قدرات 
التنقيب في البيانات في مجال الإحصاء والتنقيب في النصوص تساعدنا بالفعل على كشف 
خصائص مخاطر إضافية» مما يجعل من الممكن التنبؤ بالادعاءات الطبية الخطيرة في 
المراحل الأولى من Statistica J> gag Säll‏ يمكننا تقديم تقديرات أكثر دقة من 
إجمالي الأضرار والتخطيط وفقًا لذلك“. 

توسعات في عروض الخدمات للأعضاء: 

ومما زاد من سعادة 16011"12 أيضًا من حل 58150162 هو أنه مكن ٤18‏ من 
تقديم خدمات إضافية لأعضاء شركاتهاء حيث يقول: ”نحن في نشاط قائم على البيانات. 
«Statistica eas‏ ممكننا تزويد أعضائنا بتحليلات مفصلة للمطالبات واتجاهات السوق. 
i Statistica BaeLus S‏ تقديم توصيات أقوى بشأن احتياطيات المطالبات“. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري eya‏ 


الفصل الخامس 


البديهية بالنسبة لمستخدمي الأعمال: 

يمكن الوصول إلى أدوات 5686156168 البديهية حتى من قبّل المستخدمين غير الفنيين. 
35 هذا الصدد يقول 10112'18: ”من السهل فهم مخرجات تحليلات الإحصائيات بالنسبة 
ممستخدمي الأعمال. ويكتشف مستخدمو الشركات أيضًا أن نتائج التحليل تسير على نفس 
نهج تجاربهم وتوصياتهم» لذا فبإمكانهم أن يشعروا بسهولة بقيمة حل 15]162اها5". 

أسئلة للمناقشة: 

-١‏ كيف يمكن استخدام تحليلات النص والتنقيب فيه لمواكبة الاحتياجات التجارية 
المتغيرة لشركات التأمين؟ 

Us -Y‏ هي التحديات والحل المقترح والنتائج التي تم الحصول عليها؟ 

"'- هل يمكنك التفكير في استخدامات أخرى لتحليلات النصوص والتنقيب في النص 
لشركات التأمين؟ 
Sources: Dell Statistica Case Study. Insurance group strengthens risk management‏ 
with text mining solution. https://software.dell.com/casestudy/czech-insurers-‏ 


bureau-insurance-group-strengthens- risk-management-with875134/(accessed June 


2016). Used by permission from Dell. 


أسئلة مراجعة على القسم ه-7: 

-١‏ ما هي تحليلات النص؟ وكيف تختلف عن التنقيب في النص؟ 
bo -Y‏ هو التنقيب في النص؟ وكيف يختلف عن التنقيب في البيانات؟ 
ISU -‏ يزداد انتشار التنقيب في النص كأداة تحليلية؟ 

-٤‏ ما هي بعض مجالات التطبيق الأكثر انتشارًا في التنقيب في النص؟ 


:)N1۲( معالجة اللغات الطبيعية‎ ٠-٥ 

تستخدم بعض تطبيقات التنقيب ال مبكر في النص تمثيلًا مبسطًا يُسمى حقيبة الكلمات وذلك 
لإضفاء الهيكلة على مجموعة من الوثائق النصية لتصنيفها إلى فتتين أو أكثر من الفئات ال محددة 
مسبقًا أو تجميعها في تجمعات طبيعية. وفي نموذج حقيبة الكلمات» يتم تمثيل النص - جملة أو 
فقرة أو وثيقة كاملة - كمجموعة من الكلمات: دون تجاهل قواعد أو ترتيب ظهور الكلمات. 


£v.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


ولايزال نموذج حقيبة الكلمات يستخدم في بعض أدوات تصنيف الوثائق البسيطة. فمثلا في 
تصفية الرسائل غير المرغوب فيهاء يمكن تصميم رسالة البريد الإلكتروني كمجموعة غير مرتبة من 
الكلمات (حقيبة كلمات) تتم مقارنتها بحقيبتين مختلفتين محددتين مسبقًاء حيث تمتلئ حقيبة 
واحدة بالكلمات الموجودة في رسائل البريد غير المرغوب فيه والأخرى مليئة بكلمات تم العثور 
عليها في رسائل البريد الإلكتروني الاعتيادية. وعلى الرغم من أنه من المتوقع وجود بعض الكلمات 
في كلا الحقيبتينء فإن حقيبة ”البريد غير المرغوب فيه“ تتكرر فيها كلمات تتعلق بالرسائل غير 
المرغوب فيها - مثل المخزونء والفياجراء والشراء - أكثر من تكرارها في الحقيبة الاعتيادية» والتي 
ستحتوي على المزيد من الكلمات المتعلقة بأصدقاء المستخدم أو مكان العمل. ويقوم مستوى 
التماثل بين حقيبة الكلمات الخاصة بالبريد الإلكتروني والحقيبتين اللتين تحتويان على التوصيفات 
بتحديد البريد الإلكتروني على أنها إما رسائل غير مرغوب فيها أو اعتيادية. 

وبطبيعة الحالء لاا نستخدم نحن (البشر) كلمات غير ذات ترتيب أو هيكلء بل نستخدم 
كلمات في جمل لها بنية دلالية ونحوية. وبالتاليء فإنه يجب أن تبحث التقنيات الآلية (مثل 
التنقيب في النص) عن طرق لتجاوز تفسير حقيبة الكلمات وتضمين بنية دلالية أكثر وأكثر في 
عملياتها. ويتجه التنقيب في النص حاليًا نحو تضمين العديد من المميزات المتقدمة التي يمكن 
الحصول عليها باستخدام معالجة اللغات الطبيعية 5.آ2]1. 

وقد اتضح أن طريقة حقيبة الكلمات قد لا تنتج محتوى معلومات كاف بشكل جيد للهام 
التنقيب في النص (مثل التصنيفء والتجميع:؛ والاقتران). وخير مثال على هذاء يمكننا الحصول 
عليه في الطب القائم على الأدلة. ويتمثل أحد المكونات الحساسة للطب القائم على الأدلة في 
دمج أفضل نتائج البحوث المتاحة في عملية اتخاذ القرارات الإكلينيكية: والتي تنطوي على تقييم 
المعلومات التي تم جمعها من وسائل التواصل المطبوعة بالنسبة لصلاحيتها ومدى صلتها. وقد 
طور العديد من الباحثين من جامعة ميريلاند نماذج تقييم الأدلة باستخدام طريقة حقيبة الكلمات 
33s. (Lin & Demner-Fushman, 2005)‏ استخدموا أساليب تعلم الآلة الشائعة بالإضافة إلى 
أكثر من نصف مليون بحث تم جمعها من :11581(1:12115 (نظام تحليل وتحرير أدبيات الطب على 
الإنترنت). وقد قاموا بتمثيل كل ملخص كحقائب كلمات في النماذج التي قدموهاء حيث كان 
كل مصطلح محدد هثل ميزة. وعلى الرغم من استخدام أساليب التصنيف الشائعة مع منهجيات 
التصميم التجريبي المجربةء فلم تعدو نتائج التنبق الخاصة بهم كونها مجرد تخمين بسيط مما 
يشير إلى أن حقيبة الكلمات لا تنتج تمثيلًا جيدًا مما فيه الكفاية للمواد البحثية في هذا ا مجال؛ 
وبالتالي فإن هناك حاجة إلى مزيد من التقنيات المتقدمة مثل معالجة اللغات الطبيعية ©.آ27. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري e‏ 


الفصل الخامس 


وتعتبر معالجة اللغات الطبيعية (:21) أحد المكونات المهمة في التنقيب في النصوص» وهي 
عبارة عن مجال فرعي من الذكاء الاصطناعي وعلوم لغات الحاسوب. كما أنها تدرس مشكلة 
”فهم“ لغة الإنسان الطبيعيةء من وجهة نظر تحويل الصور البشرية (كالوثائق النصية) إلى تمثيلات 
أكثر رسمية (في شكل بيانات رقمية ورمزية) تسهل على برامج الحاسب إجراء المعالجات المطلوبة 
shy‏ والهدف من معالجة اللغات الطبيعية هو إجرء المعالجة البارعة للنصوص اللبنية على 
بناء الجملة (والذي غالبًا ما يطلق عليه ”عد الكلمات*) بشكل يوصل إلى فهم حقيقي ومعالجة 
اللغة الطبيعية التي تدرس القيود النحوية والدلالية وكذلك السياق. 
ويعتبر تعريف ونطاق كلمة الفهم أحد موضوعات النقاش الرئيسية في معالجة اللغات 
NLP ieuh‏ وبالنظر إلى أن اللغة البشرية الطبيعية مبهمة, وأن الفهم الحقيقي للمعنى 
يتطلب معرفة واسعة بموضوع ما (يتجاوز ما هو موجود في الكلمات والجمل والفقرات)؛ فهل 
ستتمكن أجهزة الحاسب من فهم اللغة الطبيعية بنفس الطريقة وبنفس الدقة التي يفعلها البشر؟ 
والإجابة هي لا على الأغلب! لقد قطعت معالجة اللغات الطبيعية 711:2 شوطًا طويلًا منذ وقت 
استخدام العد البسيط للكلمات» غير أن هذه ابمعالجة للغات الطبيعية لديها طريقة أطول لتتمكن 
من الفهم الحقيقي للغة الإنسان الطبيعية. ونذكر فيما يلي عددًا قليلًا من التحديات المرتبطة 
بشكل عام بتنفيذ معالجة اللغات الطبيعية :N1۲‏ 
- علامات جزء من الكلام: من الصعب ترميز المصطلحات في النص على أنها تطابق جزءًا معيئًا من 
الكلام (مثل الأسماء والأفعال والصفات والظروف) لأن جزء الكلام لا يعتمد فقط على تعريف 
المصطلح ولكن أيضًا على السياق الذي يتم استخدامه فيه. 
- تقسيم النص: بعض اللغات المكتوبة» مثل الصينية واليابانية والتايلاندية لا تحتوي على حدود 
مفردة للكلمات. وفي هذه الحالات فإن مهمة تحليل النص تتطلب تحديد حدود الكلمات» 
والتي غالبًا ما تكون مهمة صعبة. حيث تظهر تحديات مماثلة في تجزئة الكلام عند تحليل اللغة 
المحكية لأن الأصوات التي تمثل الحروف والكلمات المتعاقبة تمتزج مع بعضها البعض. 
- توضيح معنى كلمة: حيث توجد كلمات كثيرة لها أكثر من معنى واحد, ولا يمكن أن يتحقق 
اختيار المعنى الأكثر اعتيادية إلا مراعاة السياق الذي تستخدم فيه الكلمة. 
- الغموض النحوي: حيث إن قواعد اللغة للغات الطبيعية غامضة؛ ولذلك فإن العديد من هياكل 
الجملة ال ممكنة في كثير من الأحيان تحتاج إلى النظر فيهاء حيث إن اختيار البنية الأكثر ملاءمة 
يتطلب عادةً انصهار المعلومات الدلالية والسياقية. 


ery‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


- عدم الكمال أو عدم انتظام المدخلات: اللهجات الأجنبية أو الإقليمية والعوائق الصوتية في 

الكلام والأخطاء المطبعية أو النحوية في النصوص تجعل معالجة اللغة مهمة أكثر صعوبة. 
- أفعال لفظية: يمكن اعتبار الجملة في كثير من الأحيان إجراء من J‏ المتحدث. فقد لا يحتوي 

هيكل الجملة وحده على معلومات كافية لتحديد هذا الإجراء. فعلى سبيل المثال: ”هل يمكنك 

اجتياز الصف؟“ يتطلب إجابة بسيطة؛ نعم / لاء في حين أن ”هل يمكنك تمرير املح؟“ هو طلب 

لإجراء مادي يجب القيام به. 

لقد طال انتظار هذا الحلم من جانب مجتمع الذكاء الاصطناعي في إيجاد خوارزميات قادرة 
على القراءة والحصول على المعرفة من النص. ومن خلال تطبيق خوارزمية تعمل على نص معقد. 
قام باحثون من مختبر 211,2 بجامعة ستانفورد بتطوير طرق هكنها تحديد المفاهيم والعلاقات 
بين تلك المفاهيم في النص تلقائيًا. ومن خلال تطبيق إجراء فريد على كميات كبيرة من النصوص» 
فإن خوارزمياتها تحصل تلقائيًا على مئات الآلاف من عناصر المعرفة العالمية وتستخدمها لإنتاج 
مستودعات معززة بشكل كبير ل ]18050276. وغ110:0216 هي قاعدة بيانات مشفرة يدويا 
من الكلمات الإنجليزية» وتعريفاتهاء ومجموعات من المرادفات» والعلاقات الدلالية المختلفة بين 
المجموعات ال مترادفةء وهي مورد رئيسي لتطبيقات معالجة اللغات الطبيعيةء ولكن ثبت أن تكلفة 
بنائها وصيانتها اليدوية مرتفعة للغاية. ومن خلال إحداث المعرفة تلقائيًا في )1100716 فإنه 
توجد إمكانية لجعل 11007166 موردًا أكبر وأكثر شمولا لمعالجة اللغات الطبيعية بجزء صغير 
من التكلفة. وتُعد إدارة علاقات العملاء ya (CRM)‏ أحد المجالات البارزة التي تظهر فيها 
فوائد معالجة اللغات الطبيعية )N1(‏ وا0۲3۸ بالفعل. وبوجه عام CRM ob‏ يسعى 
بجدية إلى تقدير العملاء من خلال فهم أفضل واستجابة فعالة لاحتياجاتهم الفعلية والمتوقعة. 
ويُعد تحليل المشاعر أحد المجالات المهمة في إدارة علاقات العملاء (13/1©): حيث يكون ممعالجة 
اللغات الطبيعية (771:5) تأثير كبير في تحليل المشاعر. وتحليل المشاعر هو تقنية تستخدم 
لكشف الآراء المؤيدة وغير المؤيدة تجاه منتجات وخدمات معينة باستخدام عدد كبير من مصادر 
البيانات النصية (ملاحظات العملاء في شكل منشورات على شبكة الإنترنت). وسوف نتناول في 
القسم 1-0 تحليل ا مشاعر «(eo WordNets‏ من التفصيل. 
ويمكن استخدام التحليلات بشكل عام وتحليلات النصوص والتنقيب في النص بشكل خاص في 

صناعة البث الإذاعي. وتقدم الحالة العملية ۲-١‏ مثالًا على ذلك حيث يتم استخدام نطاق واسع من 
إمكانات التحليلات لالتقاط مشاهدين جدد وتوقع التقييمات وإضافة قيمة أعمال إلى شركات البث. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ery‏ 


الفصل الخامس 


حالة عملية ۲-١‏ 
استخدام شبكات 4110 التحليلات لجذب مشاهدين جدد وتقييم التوقعات وإضافة 
القيمة للمعلنين في عام متعدد القنوات 

على مدى العشر سنوات الماضية كانت صناعة التلقاز المعتمد على كيبل في الولايات 
المتحدة تتمتع بفترة من النمو أتاحت إبداعًا غير مسبوق في إنشاء محتوى عالي الجودة. 
كانت شركة 7166:00:15 4110 في طليعة هذا العصر الذهبي الجديد للتلفاز. مما أدى 
إلى إنتاج سلسلة من العروض المشهود لها بالنجاح بشكل حاسم مثل: Breaking Bad‏ 
-Ihe Walking Dead Mad Meng‏ 

وتمتلك شركة 72160115 4110 المتخصصة في إنتاج محتوى مرثي من البرامج 
والأفلام بجودة عالية منذ أكثر من ٠٠١‏ عامّاء العديد من العلامات التجارية الأكثر شعبية 
والحائزة على جوائز في مجال التلفاز المعتمد على كيبلء والتي تنتج وتقدّم محتوى 
osa‏ وممتعًا وثقافيًا يجذب الجماهير عبر منصات متعددة. 

تصدر اللعبة: 

ies‏ الرغم من نجاح شركة 15زه0اء77 4310: إلا أنها hs elig Y‏ للبقاء على 
أمجادها. وقد وضح 151515 '(171]21. الباحث SVP Business Intelligence gob» je‏ 
ذلك بقوله: ”نحن لا نقف هكذا بدون تقدم. فعلى الرغم من أن نسبة كبيرة من 
lib Jis Y Uksi‏ خطيًاء إلا أننا نحتاج إلى جذب جيل جديد من جيل الألفية الذين 
يستهلكون المحتوى بطرق مختلفة جدًا. لقد تطور التلفاز ليصبح عملًا متعدد القنوات 
ومتعدد الأنظمة» ومن تم فقد أصبحت الشبكات السلكية بحاجة إلى أن تكون أكثر 
ذكاءً حول كيفية تسويقها والتواصل مع الجمهور عبر جميع تلك التدفقات. والجدير 
بالذكر أن الاعتماد على بيانات التقديرات التقليدية ومقدمي تحليلات الجهات الخارجية 
تعد إستراتيجية خاسرة: تحتاج إلى الحصول على ملكية بياناتك. واستخدامها للحصول 
على صورة أكثر ثراءً عن هوية المشاهدينء وماذا يريدون: وكيف يمكنك الحفاظ على 
انتباههم في سوق الترفيه المزدحم بشكل متزايد“. 

تقسيم المشاهدات: 

يتمثل التحدي في أن هناك الكثير من المعلومات المتاحة فقط - مئات المليارات من 
صفوف البيانات من مزودي خدمات بيانات الصناعة مJû «com-Scoreg Nielsen‏ 


tre‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


من قنوات pil AMOC’ TV Everywhere Jis‏ تعيش على شبكة الإنترنت وخدمات 
الفيديو حسب الطلبء Sklas Amazons iTunes Jis jaib gl å go‏ 
الفيديو عبر الإنترنت من جهات خارجية مثل -Netflix and Hulu‏ 

يقول V" :Vitaly Tsivin‏ مكننا الاعتماد على ملخصات عالية المستوى؛ فنحن 
نحتاج إلى أن نكون قادرين على تحليل كل من البيانات المنظمة وغير المهيكلة دقيقة 
بدقيقة “alig soling‏ ويضيف قائلا: ”نحتاج إلى معرفة من يشاهد المحتوى وماذاء 
ونحتاج إلى معرفة ذلك بسرعة حتى نتمكن» على سبيل JÈL‏ من اتخاذ قرار بشأن ما إذا 
كان سيتم عرض إعلان أو عرض ترويجي في موضع معين خلال حلقة الرجال المجانين". 

وقد قررت شركة 4810 أنها بحاجة إلى تطوير القدرة التحليلية في مجال الصناعة 
داخل الشركة -وتركز على توفير هذه الإمكانية في أسرع وقت ممكن. وبدلًا من إجراء 
عملية اختيار طويلة ومكلفة للموردين والمنتجينء قررت شركة :4210 الاستفادة من 
علاقتها الحالية مع شركة 1823/1 كشريكها التقني الإستراتيجي الموثوق به. a aus‏ ذلك» 
فقد تم استثمار الوقت والمال الذي يتم إنفاقه تقليديًا على الشراء في تحقيق الحل -مما 
يسرع من تقدم ©4316 على خريطة الطريق الخاصة بتحليلاتها لمدة 7 أشهر على الأقل. 

تمكين قسم البحوث: 

لقد قضى فريق البحث في 48110 في الماضي جزءً كبيرًا من الوقت في معالجة 
البيانات. واليوم #مكنت 4010 من تركيز معظم طاقتها على اكتساب رؤى قابلة 
للتطبيق» وذلك بفضل أدوات التحليل الجديدة. 

JMe- oa" ;Vitaly Tsivin Jg»‏ الاستثمار في تقنية تحليلات البيانات الضخمة 
من 18M‏ تمكنا من زيادة وتيرة أبحاثنا وتفاصيلهاء فالتحليلات التي كانت تستغرق 
أيامًا وأسابيع يكن إنجازها الآن في دقائق» أو حتى ثوان. إن توفير التحليلات الداخلية 
سيوفر الكثير من التكاليف. فبدلًا من دفع مئات الآلاف من الدولارات إلى الباعة 
الخارجيين عندما نحتاج إلى بعض التحليلء فإنه يمكننا القيام بذلك بأنفسنا -بدقة أكثر, 
وسرعة كبيرة: وتكلفة أقل بكثير. ونحن نتوقع رؤية عائد سريع على الاستثمار. ومع 
توفر المزيد من مصادر الرؤية المحتملة والتحليلات التي أصبحت أكثر إستراتيجية لقطاع 
الأعمالء فإن النهج الداخلي هو في الواقع الطريقة الوحيدة المقبولة لأي شبكة ترغب 
Ó>‏ $ اكتساب ميزة تنافسية من بياناتها“. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري tro‏ 


الفصل الخامس 





توجه القرارات بالبيانات: 

تُظهر العديد من النتائج التي توصل إليها هذا التحليل الجديد تحولًا حقيقيًا في 
طريقة عمل ©421. فعلى سبيل المثال» نجد أن قسم ذكاء الأعمال في الشركة استطاع 
إنشاء نماذج إحصائية متطورة تساعد الشركة على تحسين إستراتيجياتها التسويقية 
واتخاذ قرارات أكثر ذكاءً بشأن مدى قوة الترويج لكل عرض. 
مجهزة | تقوم شركة ©4281 بجمع بيانات 
التقييمات مع معلومات المشاهد 
من مجموعة كبيرة من القنوات 
الرقمية: خدمات الفيديو الخاصة 
بهاعند الطلب وخدمات البث 
المباشر وتجار التجزئة وخدمات 
التلفاز عبر الإنترنت. 








مترابطة | يعمل محرك البيانات والتحليلات 
الضخم والشامل على تحفيز 
البيانات وجعلها متاحة لمجموعة 
من الأدوات التحليلية الوصفية 
والتنبؤية للنمذجة السريعة والإبلاغ 
والتحليل السريع. 























era‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


























التحليلات التنبؤية (۲): تحليلات النص والويب ووسائل التواصل الاجتماعي 


ذكية | يستطيع 41٥‏ التنبؤ بالبرامج 
الناجحةء وكيفية ترتيبهاء والعروض 
التي يجب آن تنشئهاء ومن يجب 
عليها تسويقها- مما يساعد على 
كسب جماهير جديدة في سوق 
المنافسة المتزايدة. 

















وبنظرة أكثر عمقًا على نسبة المشاهدة. فإن حملات ©4301 التسويقية المباشرة 
تحقق هي الأخرى نجاحًا أكبر. وفي أحد الأمثلة الحديثة. ساعدت التجزئة الذكية 
ونمذجتها الشبيهة الشركة في استهداف المشاهدين الجدد والحاليين بشكل فعال بحيث 
كانت معاملات الفيديو حسب الطلب في 4310 أعلى مما كان متوقعًا بخلاف ذلك. 

والجدير بالذكر أن هذه القدرة المكتشفة حديئًا للوصول إلى مشاهدين جدد والتي 
تستند إلى احتياجاتهم وتفضيلاتهم الفردية لا تُعد فقط قيمة بالنسبة إلى ©4116 - بل 
إنها تتمتع أيضًا بقيمة هائلة محتملة لشركاء الإعلان في الشركة. حيث تعمل ۸۸٤‏ 
حاليًا على توفير الوصول إلى مجموعات البيانات وأدوات التحليل الغنية الخاصة بها 
كخدمة للمعلنين» مما يساعدهم على تحسين حملاتهم من أجل جذب جماهير أكبر من 
ذي قبل عبر القنوات الخطية والرقمية. 

ويخلص 15۷1١‏ 17131 إلى أنه: «يمكننا الآن الاستفادة من قيمة البيانات الكبيرة. 
يمكننا بناء اقتراح أكثر جاذبية لكل من ال لمستهلكين وا معلنين» وإنشاء محتوى أفضل 
وتسويقه بشكل أكثر فاعلية ومساعدته على الوصول إلى جمهور أوسع من خلال أخذ 
الاستفادة الكاملة من قدراتنا متعددة القنوات». 

أسئلة للمناقشة: 

-١‏ ما هي التحديات الشائعة التي تواجهها شركات البث في الوقت الحاضر؟ وكيف 
يمكن أن تساعد التحليلات على التخفيف من هذه التحديات؟ 

àS -Y‏ استفادت ©4381 من التحليلات لتعزيز أداء أعمالها؟ 

- ما هي أنواع تحليلات النصوص والحلول المصغرة النصية التي طورتها شبكات 
FAMC‏ وهل كنك التفكير في استخدامات أخرى محتملة لتطبيقات استخراج النص 
في صناعة البث؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري erv‏ 








الفصل الخامس 


Sources: IBM Customer Case Study. Using analytics to capture new viewers, predict 
ratings and add value for advertisers in amultichannel world. http://www-03.ibm.com/ 
software/busi-nesscasestudies/us/en/corp?synkey-A023603A76220M60 (accessed 


July 2016); www.ibm.com; www.amcnetworks.com. 
ويتم تطبيق معالجة اللغات الطبيعية 711:5 بنجاح على مجموعة متنوعة من المجالات‎ 

لمجموعة واسعة من المهام عبر برامج الحاسب معالجة اللغة البشرية الطبيعية تلقائيًا والتي كان 

يمكن القيام بها في السابق من قبل البشر فقط. وفيما يلي بعص من أكثر هذه المهام شيوعًا: 

- إجابة الأسئلة: وهي مهمة الرد التلقائي على السؤال المطروح باللغة الطبيعية؛ أي إنتاج إجابة 
لغوية عند طرح سؤال لغوي بشري. وللعثور على إجابة لسؤالء فإن برنامج الحاسب قد 
يستخدم قاعدة بيانات تم تنظيمها أو مجموعة من وثائق اللغة الطبيعية (نص أساسي مثل 
(World Wide Web‏ 

- التلخيص التلقائي: وهو إنشاء نسخة من وثيقة نصية بواسطة برنامج حاسب يحتوي على أهم 
النقاط في الوثيقة الأصلية. 

- توليد لغة طبيعية: حيث تقوم الأنظمة بتحويل المعلومات من قواعد بيانات الحاسب إلى لغة 
بشرية يمكن قراءتها. 

- فهم اللغة الطبيعية: حيث تقوم الأنظمة بتحويل عينات من اللغة البشرية إلى تمثيلات أكثر 
رسمية يسهل على برامج الحاسب التلاعب بها. 

- الترجمة الآلية: وهي الترجمة التلقائية للغة إنسانية واحدة إلى لغة أخرى. 

- قراءة اللغة الأجنبية: برنامج حاسوبي يساعد المتحدث باللغات غير الأصلية على قراءة لغة 
أجنبية مع النطق الصحيح واللهجات على أجزاء مختلفة من الكلمات. 

- الكتابة باللغة الأجنبية: برنامج حاسب يساعد المستخدم غير الأصلي في الكتابة بلغة أجنبية. 

- التعرف على الكلام: يحول الكلمات المنطوقة إلى مدخلات قابلة للقراءة آليّا. وبالنظر إلى مقطع 
صوت لشخص يتحدث ينتج النظام إملاءً نصيًا. 

- النص إلى الكلام: يطلق أيضًا عليه تركيب الكلام» يقوم برنامج الحاسب تلقائيًا بتحويل نص 
اللغة العادية إلى خطاب إنساني. 

- تدقيق النص: يقوم برنامج الحاسب بقراءة نسخة من النص لإثبات وتصحيح أي أخطاء. 

- التعرف الضوني على الحروف: الترجمة الآلية لصور مكتوبة بخط اليد أو مطبوعة أو مطبعية 
als)‏ ما يتم التقاطها بواسطة ماسح ضوني) وتحويلها إلى وثائق نصية قابلة للتحرير آليًاء 


£Y^‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


ويعتمد نجاح وشهرة التنقيب في النص على التقدم في معالجة اللغات الطبيعية JS È NLP‏ 
جيل كما هو الحال في فهم اللغات البشرية. وتتيح معالجة اللغات الطبيعية N1۴‏ استخراج 
الخصائص من النص غير المهيكل بحيث يمكن استخدام مجموعة متنوعة من تقنيات التنقيب في 
البيانات لاستخراج ا معرفة (أنماط وعلاقات جديدة ومفيدة) من ذلك النص. 


أسئلة مراجعة على القسم 8-0: 

SNLP ما هي معالجة اللغات الطبيعية‎ -١ 

۲- كيف ترتبط معالجة اللغات الطبيعية بالتنقيب قي النصوص؟ 

- اذكر بعض الفوائد والتحديات لمعالجة اللغات الطبيعية N1۲؟‏ 

ع- ما هي اللهام الأكثر انتشارًا التي تتناولها معالجة اللغات الطبيعية SNLP‏ 


6-0 تطبيقات التنقيب في النص: 

نظرًا لزيادة كمية البيانات غير المنظمة التي يتم جمعها من قبل المؤسسات: فإن اقتراح أدوات 
للتنقيب في النص فائقة القيمة وذات انتشار واسع تزداد أيضًا. وتدرك العديد من المنظمات في 
الوقت الراهن أهمية استخراج المعرفة من مستودعات البيانات المستندة إلى الوثائق من خلال 
استخدام أدوات التنقيب في النص. وفيما يلي نذكر مجموعة فرعية صغيرة فقط من فئات 
التطبيقات المثالية للتنقيب في النص. 


تطبيقات التسويق: 

يمكن استخدام التنقيب في النص لزيادة البيع المتقاطع والبيع من خلال تحليل البيانات غير 
المهيكلة الناتجة عن مراكز الاتصال. كما يمكن تحليل النصوص التي تم إنشاؤها بواسطة ملاحظات 
مركز الاتصال؛ بالإضافة إلى نسخ المحادثات الصوتية مع العملاء من خلال خوارزميات التنقيب في 
النص لاستخراج معلومات جديدة وعملية حول تصورات العملاء تجاه منتجات وخدمات الشركة. 
وبالإضافة إلى ذلك تعد المدونات» وملاحظات المستخدمين للمنتجات في مواقع الويب المستقلة, 
ومنشورات لوحات المناقشة كنرًا ذهبيًا وممكن من خلاله التعرف على مشاعر العملاء؛ حيث يمكن 
استخدام هذه المجموعة الغنية من ال معلومات. مجرد تحليلها بشكل صحيح» لزيادة رضا العميل 
والقيمة الإجمالية طمدة تعامله -(Coussement & Van den Poel, 2008) .àS JI g^‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري era‏ 


الفصل الخامس 


لقد أصبحت قيمة التنقيب في النص لا تُقدر بثمن لإدارة علاقات العملاء؛ حيث يمكن 
للشركات استخدام التنقيب في النص لتحليل مجموعات غنية من البيانات النصية غير الهيكلية, 
مقترنة بالبيانات المنظمة ذات الصلة المستخرجة من قواعد البيانات التنظيمية» للتنبؤ بتصورات 
العملاء وسلوك الشراء اللاحق. وقد نجج Van den Poelg Coussement jn JÛ‏ )2009( 
في تطبيق التنقيب في النص بنجاح من أجل تحسين قدرة نموذج ما على التنبؤ بشكل أفضل 
باضطراب العملاء (أي تناقص العملاء) بحيث يتم تحديد العملاء الأكثر عرضة للغادرة الشركة من 
أجل القيام بالتكتيكات اللازمة للحفاظ عليهم. 

وقد استخدم نصهط6 وآخرون )٠٠١7(‏ التنقيب في النص لتطوير نظام قادر على استنتاج 
سمات ضمنية وصريحة من المنتجات من أجل تعزيز قدرة تجار التجزئة على تحليل قواعد بيانات 
المنتجات. إن معالجة المنتجات كمجموعات من أزواج السمة والقيمة وليس ككيانات بسيطة 
يمكن أن تعزز فعالية العديد من تطبيقات الأعمالء بما في ذلك التنبؤ بالطلب» وتحسين التركيب» 
بالإضافة إلى توصيات المنتجات» ومقارنة التركيب بين تجار التجزئة والمصنعين» فضلًا عن اختيار 
موردي المنتجات. ويسمح النظام المقترح للأعمال التجارية بتمثيل منتجاتها من حيث السمات 
وقيم السمات بدون جهد يدوي كبير. كما يتعلم النظام هذه السمات عن طريق تطبيق تقنيات 
التعلم تحت إشراف شبه موجه 6151560م5611500 على وصف المنتجات الموجودة في مواقع 
الويب الخاصة بتجار التجزئة. 


تطبيقات الأمان: 

رها يكون أحد أكبر وأبرز تطبيقات التنقيب في النص في مجال الأمان نظام المراقبة 110111:1.011 
المصنف بدرجة عالية. وكما هو معروفء فإنه من ال مفترض أن يكون نظام 0111:1071 قادرًا 
على تحديد محتوى المكالمات الهاتفية والفاكسات والبريد الإلكتروني وأنواع أخرى من البيانات» 
بالإضافة إلى اعتراض المعلومات المرسلة عبر الأقمار الصناعيةء وشبكات الهاتف العمومية التبديلية, 
وروابط الميكروويف. 

وفي عام aY -V‏ قامت ,817110801 بتطوير نظام متكامل يمكنه الوصول إلى كميات هائلة من 
مصادر البيانات المهيكلة وغير المهيكلة» وتخزينها وتحليلها لتتبع الجريمة المنظمة عاليًا. ويطلق على 
نظام التحليل الشامل لدعم أجهزة الذكاء اسم نظام (04515)»: ويهدف هذا النظام إلى دمج أحدث 
تقنيات التنقيب في البيانات والنص المتوفرة في السوق في الوقت الحالي. وقد مكن نظام .581110501 
من إحراز تقدم كبير في دعم أهداف تطبيق القانون على 55:44( XEUROPOL, 2007) (J5.J‏ 


tes‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


ويقوم كل من مكتب التحقيقات الفيدرالي الأمريي (581) ووكالة المخابرات المركزية (°14)» 
تحت إشراف وزارة الأمن الوطني» بتطوير نظام للبيانات العملاقة والنصوص. ومن المتوقع أن 
ان النظام مستودع بيانات ضخم إلى جانب مجموعة متنوعة من وحدات البيانات والتنقيب 
في النص لتلبية احتياجات اكتشاف اللعرفة لوكالات تطبيق القانون الفيدرالية والولائية والمحلية. 
وقد كان لكل من مكتب التحقيقات الفيدرالي ووكالة المخابرات المركزية قبل هذا المشروع قاعدة 
بيانات منفصلة خاصة بهاء مع القليل من الترابط أو حتى بدونه. 

وهناك تطبيق آخر من تطبيقات التنقيب في النصوصء هذا التطبيق في مجال كشف الخداع: 
وهو تطبيق التنقيب في النص على مجموعة كبيرة من التصريحات الإجرامية في العالم الحقيقي 
(شخصية الفائدة)» وقد وضع كل من jao $al gòl (2008) Deleng Birosg Fuller‏ 
البيانات الكاذبة من البيانات الصادقة. وباستخدام مجموعة غنية من الإشارات المستخلصة من 
البيانات النصية» يتنبأ النموذج بعينات الدقة بنسبة >۷٠‏ والتي يعتقد أنها نجاح كبير مع الأخذ في 
الاعتبار أن الإشارات يتم استخلاصها فقط من البيانات النصية (لا توجد إشارات شفوية أو بصرية). 
boe‏ على ذلكء فبالمقارنة مع تقنيات كشف الخداع الأخرى؛ مثل جهاز كشف الكذبء فإن هذه 
الطريقة غير متداخلة وقابلة للتطبيق على نطاق واسع ليس فقط للبيانات النصية: ولكن أيضًا 
(محتمل) إلى نسخ التسجيلات الصوتية. ويرد وصف أكثر تفصيلًا للكشف عن الخداع القائم على 
النص في الحالة العملية 8-0. 


حالة عملية ٠-0‏ 
التنقيب للكشف عن الأكاذيب 
تواصل الاتصالات المبرمجة تقدمها مدفوعة بالتطورات في تقنيات المعلومات على شبكة 
الإنترنت وزيادة العولمة لتتحول إلى الحياة اليوميةء حاملة معها أساليب جديدة للخداع. 
فنجد أن هناك تزايدًا سريعًا في حجم الدردشة النصية؛ والرسائل الفورية» والرسائل النصية, 
بالإضافة إلى النص الذي تولده مجتمعات الإنترنت. بل حتى البريد الإلكتروني هو أيضًا 
مستمر في تزايد استخدامه. ومع النمو الهائل في التواصل القائم على النصوص: ازدادت 
إمكانات الناس لخداع الآخرين من خلال التواصل المحوسبء مما قد يؤدي إلى نتائج كارثية. 
ولسوء الحظء فإن البشر بشكلٍ عام؛ يميلون إلى التكاسل وعدم بذل الجهد في مهام 
كشف الخداعء وتتفاقم هذه الظاهرة في الاتصالات القائمة على النص. وقد شمل جزء 
كبير من البحث عن كشف الخداع (المعروف أيضًا بتقييم المصداقية) في الاجتماعات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 3 


الفصل الخامس 


والمقابلات الشخصية المباشرة. ومع ذلكء ومع نمو الاتصالات القائمة على النصوص» فإن 
تقنيات الكشف عن الخداع المستندة إلى النصوص تعد ضرورية. 

وهناك تقنيات للكشف عن الخداع بنجاح» وقد حظيت هذه التقنيات بقابلية 
تطبيقها على نطاق واسع؛ حيث هكن لتطبيق القانون استخدام أدوات وتقنيات دعم 
القرار للتحقيق في الجرائم» وإجراء الفحص الأمني في المطارات: ومراقبة اتصالات 
الإرهابيين المشتبه بهم. وقد يستخدم المتخصصون ف الموارد البشرية أدوات كشف 
الخداع لفحص المتقدمين. فهذه الأدوات والتقنيات لديها أيضًا القدرة على فحص رسائل 
البريد الإلكتروني للكشف عن الاحتيال أو غيرها من الأفعال الخاطئة التي ارتكبها ضباط 
الشركات. وعلى الرغم من أن بعض الناس يعتقدون أنهم يستطيعون التعرف بسهولة 
على أولئك الذين ليسوا صادقينء إلا أن ملخضًا لأبحاث الخداع أظهر أن متوسط نسبة 
الأشخاص الذين يدققون في اتخاذ قرارات صائبة هي «(Bond & DePaulo, 2006) £0٤‏ 
وقد يكون هذا الرقم في الواقع أسوأ عندما يحاول البشر اكتشاف الخداع في النص. 

وباستخدام مجموعة من تقنيات التنقيب قي النص والتنقيب قي البيانات» قام كل من 
Lda (eY A) bss Fuller‏ البيانات الشخصية التي استغلها أشخاص متورطون 
في جرائم في قواعد عسكرية؛ حيث يُطلب من المشتبه بهم والشهود في هذه البيانات 
كتابة ما يتذكرونه من الحدث بكلماتهم الخاصة. وقد قام ال موظفون ال مكلفون بتنفيذ 
القانون العسكري بتفتيش البيانات الأرشيفية للإدلاء بتصريحات يمكن أن يحددوها 
بشكل قاطع بأنها صادقة أو خادعة. وقد اتُخذت هذه القرارات على أساس الأدلة 
الموثقة وحالة القضية. وبعد أن يتم تصنيفهم كصادقين أو مخادعينء يقوم الموظفون 
المكلفون بتنفيذ القانون بإزالة معلومات تحديد الهوية ويقدمون البيانات إلى فريق 
البحث. وفي المجموع. تم تلقي ۳۷١‏ بيانًا قابا للاستخدام للتحليل. وقد اعتمدت 
طريقة الكشف عن الخداع المبنية على النص التي استخدمها PYA) às,5ls Fuller‏ 
على عملية تُعرف باسم التنقيب في خاصية الرسائلء والتي تعتمد على عناصر البيانات 
وتقنيات التنقيب في النص. ويعرض الشكل (0-) وصفًا مبسطًا للعملية. 

asl Ss‏ الباحثون البيانات للمراجعة. حيث يجب أن يتم نسخ البيانات الأصلية 
المكتوبة بخط اليد في ملف معالجة النصوص. ثانيّاء تم تحديد السمات (مثل: 
الإشارات). حيث قام الباحثون بتحديد ١‏ سمة تمثل فئات أو أنواعًا من اللغة مستقلة 
نسبيًا عن محتوى النص ويمكن تحليلها بسهولة عن طريق وسائل آلية. فعلى سبيل 


ter‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


المثال» يمكن تعريف ضمير الشخص الأولء مثل: أنا أو لي دون تحليل للنص المحيط. 
ويسرد الجدول )١-0(‏ الفتات وقائمة أمثلة بالخصائص المستخدمة في هذه الدراسة. 

وقد تم استخراج الميزات من البيانات النصية وإدخالها في ملف ثابت مزيد من 
المعالجة. وباستخدام العديد من طرق اختيار الخصائص بالإضافة إلى التحقق المتقاطع 
من ٠١‏ أضعافء قارن الباحثون دقة التنبق بثلاث طرق شائعة للتنقيب في البيانات. وقد 
أشارت النتائج إلى أن نماذج الشبكات العصبية كانت صاحبة الأداء الأفضل بنسبة دقة 
تنبؤية بلغت ۷١,٤١‏ على عينات بيانات الاختبارء وجاءت أشجار القرار في ال مركز الثاني 
بنسبة ۷1,1 في حين حل في المركز الأخير الانحدار اللوجستي بنسبة 10,۲۸ . 

وتشير النتائج إلى أن الكشف التلقائي عن الخداع المبني على النص لديه القدرة على 
مساعدة المكلفين بهذه المهمة» ويمكن تطبيق هذه الطريقة بنجاح على بيانات العام 
الحقيقي. وقد تجاوزت دقة هذه التقنيات دقة معظم تقنيات كشف الخداع الأخرى» 
وذلك على الرغم من أنها كانت تقتصر على الإشارات النصية. 


العبارات المجهزة 
للمعالجة 








دلالات مستخرجة 
ومختارة 





























شكل 60-: عملية كشف الخداع القائمة على النص 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ter‏ 





الفصل الخامس 


جدول 1-5: فئات وأمثلة من الميزات اللغوية المستخدمة في كشف الخداع 














e‏ الفئة إشارات المثال 
١‏ الكمية عدد الأفعال. عدد عبارات الأسماء. إلخ 
Y‏ التعقيد متوسط عدد الجمل ومتوسط طول الجملة وما إلى ذلك 
۳ | عدم اليقين (الشك) المعدلات» الأفعال الشرطيةء إلخ 
٤‏ عدم الفورية الصوت المنفعل» والتصنيف. وما إلى ذلك 
|o‏ التعبيرية Emotiveness‏ 
1 التنوع التنوع المعقول, التكرار إلخ 
۷| الغير رسمية نسبة الأخطاء ا لمطبعية 
۸| الخصوصية |المعلومات الزمانية المكانية: والمعلومات الإدراكية, وما إلى ذلك 
٩‏ التأثير تأثير إيجابيء وتأثير سلبي: إلخ 
أسئلة للمناقشة: 


-١‏ اذا يصعب كشف الخداع؟ 
۲- كيف يكن استخدام التنقيب في النص / البيانات للكشف عن الخداع في النص؟ 
- ماهي التحديات الرئيسة في رأيك بمثل هذا النظام الآلي؟ 
Sources: Fuller, C. M., Biros, D., & Delen, D. (2008). Exploration of feature‏ 
selection and advanced classification models for high-stakes deception detection.‏ 
Proceedings of the 41st Annual Hawaii International Conference on System‏ 
Sciences (HICSS), Big Island, HI: IEEE Press, 8099-; Bond C. E, & DePaulo, B.‏ 
M. (2006). Accuracy of deception judgments. Personality and Social Psychology‏ 
Reports, 10(3), 214234-.‏ 
التطبيقات الطبية الحيوية: 
يحمل التنقيب في النص إمكانات كبيرة للمجال الطبي بشكل عام والطب الحيوي على وجه 
الخصوصء وذلك لعدة أسباب. أولّاه التوسع في الأدبيات (المواد المطبوعة) وا منشورات المنشورة 
(خاصة مع ظهور المجلات المفتوحة المصدر) في الميدان بمعدل أسي. ثانيّاء بالمقارنة مع معظم 


ttt‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 



































التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


المجالات الأخرىء فإن الأدبيات (المواد المطبوعة) الطبية هي أكثر توحيدًا وتنظيمًاه مما يجعلها 
مصدر معلومات ”أكثر ملاءمة“. وأخيراء تكون المصطلحات المستخدمة في هذا الكتاب deus à‏ 
مع وجود (علم الوجود) JI am SL ontology‏ حد ما. وفيما يلي بعض الدراسات النموذجية حيث 
تم استخدام تقنيات التنقيب في النص بنجاح في استخراج أنماط جديدة من الأدب الطبي الحيوي. 

إن التقنيات التجريبية مثل تحليل الحمض النووي المجهري (1(814): والتحليل المتسلسل 
(SAGE) ual ghh‏ ومجموعة 5عندرمع]50م '(7أ7012]ء6م5: وغيرهاء تولد كميات كبيرة 
من البيانات المتعلقة بالجينات والبروتينات. وكما هو الحال في أي نهج تجريبي آخرء فمن 
الضروري تحليل هذا الكم الهائل من البيانات في سياق المعلومات المعروفة سابقًا حول الكيانات 
البيولوجية قيد الدراسة. وتعتبر الأدبيات مصدرًا قيمًا للغاية للمعلومات للتحقق من صحة 
التجارب وتفسيرها. ولذلك؛ فإن تطوير أدوات التنقيب الآلي عن النصوص للمساعدة في مثل هذا 
التفسير هو أحد التحديات الرئيسية في أبحاث المعلوماتية الحيوية الحالية. 

إن معرفة موقع البروتين داخل الخلية يمكنه أن يساعد على توضيح دور تلك الخلية في 
العمليات الحيوية وتحديد إمكاناتها كهدف دوائي. وقد تم وصف العديد من أنظمة تحديد 
امموقع في الأدبيات؛ حيث يركز البعض على كائنات معينة» في حين يحاول البعض الآخر تحليل 
مجموعة واسعة من الكائنات الحية. وقد Shatkay göl‏ وآخرون (/1١٠٠1م)‏ نظامًا شاملًا يستخدم 
عدة أنواع من السمات المتسلسلة والنصية للتنبؤ بموقع البروتينات. ويكمن التجديد الرئيس 
لنظامهم في الطريقة التي يتم بها اختيار مصادر النص وميزاته ودمجها مع ميزات متسلسلة. وقد 
قاموا باختبار النظام على مجموعات البيانات المستخدمة سابقًا وعلى مجموعات بيانات جديدة 
وضعت خصيصًا لاختبار قوتها التنبؤية. حيث أظهرت النتائج أن نظامهم يتغلب باستمرار على 
النتائج التي تم الإبلاغ عنها مسبقًا. 

أما Chun‏ وآخرون (7١٠٠م)‏ فقد قاموا بوصف نظام يستخرج علاقات الجين المرضي من 
الأدبيات التي يتم الوصول إليها عبر 2/8101:1315 حيث قاموا ببناء قاموس لأسماء الأمراض 
والجينات من ست قواعد بيانات عامة واستخرجوا العلاقة بين المرشحين عن طريق مطابقة 
القاموس. ونظرًا لأن مطابقة القاموس تنتج عددًا كبيرًا من النتائج الإيجابية لكنها غير صحيحة, 
فقد طوّروا طريقة للتعرّف على الكيان القائم على تعلم الآلة المسمى بكيان التعرف (NER)‏ 
لتصفية التقديرات الخاطئة لأسماء الأمراض / الجينات. ووجد الباحثون أن نجاح استخلاص 
العلاقة يعتمد بشكل كبير على أداء تصفية 77512 وأن التصفية حسّنت دقة استخلاص العلاقة 
بنسبة ٠٠,۷‏ على تكلفة انخفاض صغير في إعادة الاتصال. 
ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري tto‏ 


الفصل الخامس 


ويبين الشكل (6-0) صورة مبسطة لعملية تحليل نص متعدد المستويات لاكتشاف العلاقات 
بين الجينات والبروتينات (أو تفاعلات البروتينات والبروتينات) في الأدبيات الطبية الحيوية 
.)7٠١0 55,515 Nakov)‏ وكما يتبين في هذا المثال المبسط الذي يستخدم جملة بسيطة من 
النص الطبي الحيويء حيث يتم أولًا (في المستويات الثلاثة السفلية) ترميز النص باستخدام جزء 
من الكلام مع قليل من التعديل» ثم تتم مطابقة المصطلحات (الكلمات) الرمزية (وتفسيرها) 
مقابل التمثيل الهرمي لنطاق علم الوجود لاشتقاق العلاقة بين الجين والبروتين. إن تطبيق هذه 
الطريقة (و / أو بعض اختلافاتها) على الأدبيات الطبية الحيوية يوفر إمكانات كبيرة لفك شفرة 
التعقيدات في مشروع .Human Genome‏ 







3 506 12043 24224 281020 42722 397276 
El 


019254 D044465 0001769 0092477 D003643 D016158 
م کس کم سکام س‎ 








شكل 0-»: تحليل متعدد المستويات للنص لتحديد تفاعل الجين/ البروتين 


التطبيقات الأكاديمية: 

تحظى مسألة التنقيب في النص بأهمية كبيرة بين الناشرين الذين لديهم قواعد بيانات كبيرة 
من المعلومات التي تتطلب فهرسة لاسترجاعها بشكل أفضل. وهذا صحيح بشكل خاص في 
التخصصات العلمية» والتي غالبًا ما تكون معلومات محددة للغاية يتضمنها النص المكتوب. وقد 
تم إطلاق مبادرات» مثل: اقتراح الطبيعة لواجهة التنقيب في النص eai‏ والتعريف الشائع 
لنوع وثيقة نشر المعاهد الوطنية للصحةء والتي من شأنها أن توفر مؤشرات دلالية آلية للإجابة 
عن استفسارات محددة موجودة قي النص دون إزالة حواجز الناشر للوصول إلى الجمهور. 


ع ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 














التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


كما أطلقت المؤسسات الأكادمية مبادرات التنقيب في النص. فنجد على سبيل المثال أن المركز 
الوطني للتنقيب في النص - وهو جهد تعاوني بين جامعتي مانشستر وليفربول - يوفر أدوات 
مخصصة» ومرافق بحثء ومشورة حول التنقيب في النص للمجتمع الأكاديميء مع التركيز المبدئي على 
التنقيب على النص في العلوم البيولوجية والطبية الحيوية» وقد توسعت الأبحاث منذ ذلك الحين في 
العلوم الاجتماعية. وفي الولايات المتحدة, تقوم كلية الإعلام في جامعة كاليفورنياء بيركلي» بتطوير 
برنامج يدعى 6101656 لمساعدة الباحثين في العلوم البيولوجية في التنقيب في النصوص وتحليلها. 

وكما هو موضح في هذا القسم» فإن التنقيب في النص يحتوي على مجموعة متنوعة من التطبيقات 
في عدد من التخصصات المختلفة. انظر الحالة العملية )٤-١(‏ للاطلاع على مثال لكيفية استخدام الشركة 
الرائدة في تصنيع منتجات الحوسبة في معالجة النصوص؛ من أجل فهم احتياجات ورغبات العملاء 
الحاليين والمحتملين المتعلقة بجودة المنتج وتصميم المنتج بشكل أفضل. 


حالة عملية ٤-٥‏ 
إدراج العميل ضمن معادلة الجودة: تستخدم لينوفو 1۲۸٥۷٥‏ التحلیلات من أجل 
إعادة التفكير في إعادة تصميمها 

كانت لينوفو 1.٠٠0٥۷0‏ تقترب من التصميم النهائي لتحديث تخطيط لوحة اممفاتيح 
لأحد أشهر أجهزة الحاسب الخاصة بها عندما رصدت مجتمعًا صغيرًا من اللاعبين على 
الإنترنت: غير أنه يعتبر مجتمعًا مهما وكبيراه يدعم تصميم لوحة المفاتيح الحالي. وقد 
أدى هذا التغيير في التصميم إلى تمرد جماعي لقطاع كبير من قاعدة عملاء لينوفو - 
ال مطورين ال مستقلين واللاعبين. 

وقد كانت وحدة تحليلات الشركات تستخدم 545 كجزء من مشروع الجودة 
الجوهرية. وبتتبع الويب» وغربلة البيانات النصية التي تشير إلى :555( كشف التحليل 
عن منتدى لم يكن معروقًا من قبل أن أحد العملاء الحاليين كتب مراجعة متألقة من 
ست صفحات للتصميم الحاليء خاصة لوحة المفاتيح. وقد جذب هذا الاستعراض ٠٠٠١‏ 
Ao Mohammed Chaara Js; !i3 5‏ تحليل العملاء ووعةا/زلهصة 700: ”م 
يكن الأمر شينًا وقد وجدناه في المراجعات التقليدية لتصميم ما قبل الإنتاج“. 

وقد كان هذا النوع من الاكتشافات الذي عزز التزامات الشركة لنظام لينوفو 
(LED) SAI iis‏ وعمل 3814© وفريق تحليلات الشركات الخاص به. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري tev‏ 


الفصل الخامس 


لم تنطلق شركة لينوفوء أكبر شركة لأجهزة الحاسب الشخصية والأجهزة اللوحية على 
مستوى العام» لقياس مشاعر اممدونين الغامضين أو اكتشاف المنتديات الجديدة. أرادت 
الشركة إحراز الجودة وتطوير وابتكار المنتجات من خلال ذراسة البيانات -الخاصة بها 
ومن خارج الجدران الأربعة. يقول 012858: ”نحن نركز بشكل رئيسي على تحسين 
سلسلة التوريدء وفرص البيع / بيع منتج عن طريق إقناع الزبون» والتسعير والتعبئة 
للخدمات. وأي تحسينات نجريها في هذه المجالات تستند إلى الاستماع إلى العميل“. 
وتوفر 545 الإطار ”لإدارة كمية البيانات المجنونة“ التي يتم إنشاؤهاء 

وقد انتشر نجاح المشروع كالنار في الهشيم داخل المنظمة. حيث خططت لينوفو 
في البداية لنحو ١10‏ مستخدماء ولكن شفهيًا وصلت إلى ٠٠٠١‏ مستخدم قاموا بتسجيل 
الدخول إلى لوحة اممعلومات 1۴۲ لعرض مرئي حول معنويات العملاءء والضمان» 
وتحليل مركز الاتصال. 

وكانت النتائج مذهلة: 
- تخفيض أكثر من 40۰ من وقت اكتشاف ال مشكلة. 
- تخفيض بنسبة من *٠١‏ إلى 10* في تكاليف الضمان من العيوب الخارجة عن الطبيعي. 
- تخفيض بنسبة من <١‏ إلى 0٠‏ في مكالمات مركز الاتصال للمعلومات العامة. 
النظر إلى الصورة الكبيرة: 
تتميز الطرق التقليدية لقياس المشاعر وجودة الفهم بنقاط الضعف والتأخر الزمني: 
- تعرض استطلاعات العملاء معلومات فقط من العملاء الراغبين في ذلك. 
- غالبًا ما تأق معلومات الضمان بعد أشهر من تسليم المنتج الجديد. 
- قد يكون من الصعب فك شفرة الكثير من الأسباب لسخط العملاء ومشكلات المنتج. 

وبالإضافة إلى ذلك تتبع لينوفو منتجها وتعبئته ببرامج لا تنتجهاء ويستخدم العملاء 
مجموعة متنوعة من الملحقات (محطات الإرساء وأجهزة الماوس) التي قد تكون أولا 
تكون منتجات لينوفو. ولزيادة المشكلة. تعمل الشركة في ١10‏ دولة وتدعم أكثر من 
٠١‏ لغة: لذلك كانت الطرق اليدوية لتقييم التعليق متعارضة. واستغرقت الكثير من 
الوقتء bs‏ يكن بمقدورها التوسع في حجم التعليقات التي كانت تراها في وسائل 
التواصل الاجتماعي. ويجب أن يكون تحليل المشاعر قادرًا على إدراك الفروق الدقيقة 


EtA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


في اللغات المحلية. (على سبيل المثالء طريقة وصف الأستراليين للأشياء تختلف عن 
طريقة وصف الأمريكان). 

وقد وفر الاكتشاف القائم على التحليل لمشكلة في محطات قاعدة الشحن ثاني فوز 
كبير لمبادرة 1.810 الخاصة ب 1.62070؛ حيث كان العملاء يتصلون بالدعم الفني ليقولوا 
إنهم يواجهون مشاكل في الشاشة» أو أن الجهاز مغلق بشكل مفاجئ أو أن البطارية لا 
تشحن. وقد ظهرت حسابات مماثلة على مواقع وسائل التواصل الاجتماعي. في بعض 
الأحيانء ولكن ليس داتمّاه ذكر العميل لإرساء docking gå‏ يكن الأمر كذلك قبل 
أن تستخدم لينوفو 545 لتحليل مجموعة مكوّنات مراكز الاتصال ومشاركات وسائل 
التواصل الاجتماعي التي ربطت كلمة إرساء Jelu loo AK åhh docking‏ مهندسي 
الجودة على معرفة السبب الجذري وإصدار تحديث للبرنامج. 

يقول 018354: ”لقد تمكنا من جمع هذه التعليقات في غضون أسابيع: وكانت 
تستغرق من ٠١‏ إلى ٠١‏ يومًا لأننا اضطررنا إلى انتظار عودة التقارير من الميدان”. والآن 
يستغرق الأمر من 10 إلى ٠٠١‏ يومًا فقط. وقد أدى هذا الانخفاض في وقت الاكتشاف 
إلى انخفاض بنسبة *٠١‏ إلى 10* في تكاليف الضمان لهذه المشكلات, والتي تبلغ حوالي 
۲۱ مليار دولار سنويّاء وهذه توفيرات كبيرة. 

وعلى الرغم من أن معلومات مركز الاتصال كانت حاسمة: إلا أن مكون وسائل 
التواصل الاجتماعي هو ما أغلق الصفقة. يقول 0288: ”مع تويتر وفيسبوك. وصف 
الناس ما كانوا يفعلونه في تلك اللحظة قائلين: لقد استقرت الآلة وحدث lil XX‏ 
خامدة وغير متحيزة وقوية للغاية“. 

وقد تم العثور على فكرة غير متوقعة عند تحليل ما يقوله العملاء أثناء تشغيل 
أجهزة الحاسب الشخصية الخاصة بهم. كما أدركت لينوفو أن وثائقها لشرح منتجاتهاء 
والضمانات» وما شابه لم يكن واضحًا. قال 018854: ”هناك تكلفة لكل مكامة مركز 
الاتصال. وبفضل الوثائق المحسنة: شهدنا انخفاضًا بنسبة من <٠١‏ إلى 0۰ في المكالمات 
الواردة للحصول على معلومات عامة“. 

الإشادة بالفوز وراء الخطوط الأمامية: 


كان المشروع ناحِحًا جدًا لدرجة أن 082858 عرضه على sgl CEO‏ هو تكوين عرض 
لوحة معلومات ل غ]ثناة-0). يقول 0113852: ”هذا هو مستوى التفكير من كبار التنفيذيين 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري tea‏ 


الفصل الخامس 


لديناء فهم يؤمنون بهذا. وبالإضافة إلى ذلك ستقوم مجموعة 08858 بقياس نجاح هذا 
الجهد بشكل رسمي وتوسيعه لقياس قضايا مثل تجربة العملاء عند شراء منتج "Lenovo‏ 

وقد أدى تطبيق التحليلات في نهاية المطاف إلى فهم أكثر شمولية لمفهوم الجودة. 
فالجودة ليست مجرد جهاز حاسب يعمل بشكل صحيح. ولكنها تعني معرفة الناس 
كيفية استخدامهء والحصول على مساعدة سريعة ودقيقة من الشركة» والحصول على 
مكونات غير تابعة لشركة لينوفو للعمل بشكل جيد مع الأجهزة» وفهم ما يعجب العملاء 
بشأن المنتج الحالي -بدلًا من إعادة تصميمه فقط لأن مصممي المنتجات يعتقدون أنها 
الثيء الصحيح الذي ينبغي القيام به. يقول 0112318: ”لقد سمحت لنا 545 بالحصول 
على تعريف للجودة من وجهة نظر العميل“. 

أسئلة للمناقشة: 

-١‏ كيف استخدمت لينوفو تحليلات النصوص والتنقيب في النص لتحسين جودة 
وتصميم منتجاتها وفي النهاية تحسين رضا العملاء؟ 

La -Y‏ هي التحديات والحل المقترح والنتائج التي تم الحصول عليها؟ 
المصادر: ”إحضار العميل إلى معادلة (SAS* Visual Analytics, SAS* Contextual 85. 2Jl‏ 
Se Lil ues - Analysis, SAS* Sentiment Analysis, SAS" Text Miner)‏ والتحليلات اممتقدمة 
تساعد لينوفو على تحديد مشكلات الجودة ورغبات العملاء بشكل أفضل“. 2016 © Copyrigh†‏ 
lgb aus] .SAS Institute Inc., Cary, NC, USA‏ بإذن. كل الحقوق محفوظة. 


أسئلة مراجعة على القسم 6-0: 

-١‏ اذكر وناقش باختصار بعضًا من تطبيقات التنقيب في النص في مجال التسويق. 
'- كيف يمكن استخدام التنقيب في النص في الأمن ومكافحة الإرهاب؟ 

*- ما هي بعض تطبيقات التنقيب الواعدة في النص في مجال الطب الحيوي؟ 


0-5 عملية التنقيب فى النص: 


لكي تنجح دراسات تحليل النصء فلابد أن تتبع منهجية سليمة تستند إلى أفضل الممارسات. 
حيث يلزم وجود نموذج عملية موحدة مماثل للعملية القياسية للتنقيب في البيانات الصناعية 
(1152-224©): والذي يُعد معيار الصناعة لمشاريع التنقيب في البيانات (انظر الفصل 6). وعلى 


to.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


الرغم من أن معظم أجزاء 4b CRISP-DM‏ للتطبيق أيضًا في مشروعات التنقيب في النصء فإن 
النموذج المحدد لعملية التنقيب في النص سيشمل أنشطة أكثر تفصيلًا لمعالجة البيانات. ويصور 
الشكل (0-0) مخططًا سياقيًا عالي المستوى لعملية التنقيب في النص النموذجية (& ”ما5 
(Crossland, 2008‏ حيث يعرض الرسم التخطيطي لهذا السياق نطاق العملية: مع التأكيد على 
واجهاتها مع البيئة الأكبر. وأما في جوهره: فإنه يرسم حدودًا حول العملية المحددة لتحديد ما 
يتم إدراجه في (وما يتم استبعاده من) عملية استخراج النص بشكل واضح. 

حترد الإرمجياتالاجهزة + 

قضايا الخصوصية ٠٠‏ 

الحدود اللغوية ي 


s.‏ المعرفة المتعلقة بالسياق 





مجال الخبرة : 
nina‏ : 


شكل 0-0: مخطط السياق لعملية التنقيب في النص 

وكما يشير الرسم البياني للسياق: فإن المدخلات (الاتصال الداخلي إلى الحافة اليسرى من المربع) 
في عملية اكتشاف المعرفة المستندة إلى النص هي البيانات غير المهيكلة وكذلك المهيكلة التي تجمع 
وتخزن للعملية. والناتج (الامتداد الخارجي من الحافة اليمنى للمربع) من العملية هو المعرفة 
المحددة للسياق والتي يمكن استخدامها لصنع القرار. وتتضمن عناصر التحكم» التي Lad eus‏ 
القيود (الاتصال الداخلي إلى الحافة العلوية للمربع): العملية الخاصة بالحدود من البرامج والأجهزة, 
ومشكلات الخصوصية: والصعوبات المتعلقة بمعالجة النص المقدم بلغة طبيعية. أما الآليات فتشمل 
(الاتصال الداخلي على الحافة السفلية للمربع) الخاصة بالعملية على التقنيات المناسبة وأدوات 
البرامج وخبرات المجال. والغرض الأساسي من التنقيب في النص (ضمن سياق اكتشاف ال معرفة) هو 
معالجة البيانات غير النصية (مع البيانات المنظمة, إذا كانت ذات صلة بالمشكلة التي يتم تناولها 
والمتاحة) لاستخراج نماذج ذات معنى وقابلة للتطبيق من أجل اتخاذ قرارات أفضل. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري toy‏ 








الفصل الخامس 


ويمكن تقسيم عملية التنقيب في النص ذات المستوى العالي جدًا إلى ثلاث مهام متتالية. لكل 
منها مدخلات محددة لإنتاج نواتج معينة (انظر الشكل 5-5). فإذا لم يوافق ناتج المهمة ما هو 
متوقع, لأي سببء فلا بد من الرجوع لتنفيذ امهمة السابقة. 





TR 2 مهمة 3 امهمة‎ 
إستخراج المعرفة إنشاء مصفوفة 5 قوانين‎ TT 
ate d xm ^^] Term Document: إكتشاف أنماط جديدة‎ | JG 
| aaas | [eren / E ul 
1 المهيكلة المتعلقة بالمجال‎ aon | E | E 
À | inne! à AAT Ssa 
E EK HS 
E إجات المهمة 2 هى ملف مسطح هت امهم ا‎ 
Wale ad ar VASA Cages ni E 
RT e iL ADD Kt S d) مرمزسسة ونماآج تجديع مرمرنوات»‎ 
أت ا‎ L- eA 








شكل 1-0: عملية التنقيب في النص ثلاثية الخطوات والمهام 


المهمة :١‏ تأسيس الجزء الأساسي: 

ويتمثل الغرض الرئيس من نشاط المهمة الأولى في جمع كل الوثائق المتعلقة بالسياق (مجال 
الاهتمام) الذي تتم دراسته. وقد تتضمن هذه المجموعة الوثائق النصية وملفات .70/11 ورسائل 
البريد الإلكتروني وصفحات الويب والملاحظات القصيرة. بالإضافة إلى البيانات النصية المتوفرة 
بسهولة: ius‏ أيضًا تسجيل التسجيلات الصوتية باستخدام خوارزميات التعرف على الكلام 
وجعلها جزءًا من مجموعة النصوص. 

وبمجرد تجميعهاء يتم تحويل الوثائق النصية وتنظيمها بطريقة تجعلها كلها في نفس الشكل 
التمثيلي (مثل الملفات النصية 45011) لمعالجة الحاسب. ويمكن أن تكون عملية تنظيم الوثائق 
بسيطة مثل مجموعة من مقتطفات النصوص الرقمية المخزنة في مجلد ملف أو يمكن أن تكون 
مجموعة من الروابط ممجموعة من صفحات الويب في مجال معين. كما يمكن أن تقبل العديد من 
أدوات برامج التنقيب في النص المتاحة تجاريًا كمدخلات وتحويلها إلى ملف مسطح للمعالجة. 
وبدلًا من ذلكء فإنه من الممكن إعداد الملف المسطح خارج برنامج استخراج النص ثم تقديمه 
كمدخل إلى تطبيق استخراج النص. 


المهمة ۲: تأسيس مصفوفة :Term-Document‏ 


وف هذه ال مهمة» يتم استخدام الوثائق الرقمية وامنظمة (المجموعة) لإنشاء مصفوفة (-صمع]” 
Document (TDM‏ حيث تمشل الصفوف TDM (à‏ الوثائق» أما الأعمدة فتمثل المصطلحات. 


toy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


وتتميز العلاقات بين الشروط والوثائق بمؤشرات (أي: مقياس علائقي يمكن أن يكون بسيطًا مثل 
عدد مرات حدوث المصطلح في الوثائق ذات الصلة). ويُعد الشكل )١-0(‏ مثالا موذجيًا على /101. 


: V» a SA a7 
dE > 7 g Pd «d E: 
] 55, I 1 | 
2 وثيقة‎ 1 | 
3 وثيقة‎ | 3 
4 وثيقة‎ 1 | 
| 2 
| 
| 


$ 


1 


وثيقة 5 
1 وثيقة 6 



































Term-Document ةطıسبلا المصفوفة‎ :۷-٥ شكل‎ 

ويتمثل الهدف منها في تحويل 428 الوثائق ال مهيكلة (المجموعة) إلى 15M‏ حيث يتم تعبئة 
الخلايا بالمؤشرات الأكثر ملاءمة. أما الافتراض فهو أنه يمكن تمثيل جوهر الوثيقة بقائمة وتكرار 
المصطلحات المستخدمة في تلك الوثيقة. ومع ذلك فهل جميع المصطلحات مهمة عند توصيف 
الوثائق؟ والواضح أن الإجابة هي «لا». فبعض المصطلحات» مثل: المقالات والأفعال المساعدة 
والمصطلحات المستخدمة في جميع الوثائق في ا مجموعةء ليس لها أي اختلاف في القوةء وبالتالي يجب 
استبعادها من عملية الفهرسة. وتّعد هذه القائمة من المصطلحات. والتي يُطلق عليها عادةً مصطلح 
”شروط التوقف“ أو ”كلمات التوقف“ خاصة مجال الدراسة ويجب تحديدها بواسطة خبراء ا مجال. 
ومن ناحية أخرىء فإن المرء قد يختار مجموعة من المصطلحات المحددة سلقًا والتي بموجبها يتم 
فهرسة الوثائق (وتسمى هذه القائمة من المصطلحات بشكل ملائم مصطلحات أو قاموس). بالإضافة 
إلى ذلكء فإنه من الممكن Lái‏ توفير المرادفات (أزواج المصطلحات التي سيتم التعامل معها بنفس 
الطريقة) والعبارات اممحددة (مثل ”برج إيفل“) بحيث تكون مدخلات الفهرس أكثر دقة. 

ومن عمليات الترشيح الأخرى التي ينبغي إجراؤها لإنشاء هذه المؤشرات بدقة: ما يشير 
إلى إرجاع الكلمات إلى جذورها بحيث يتم» على سبيل المثال تحديد أشكل نحوية مختلفة 
أو انحرافات للفعل وفهرستها على أنها الكلمة نفسها. فعلى سبيل ال مثال» سوف يضمن النهج 
التشغيلي أن يكون التشكيل والتصميم معروقًا على غرار نموذج الكلمة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري tor‏ 









































الفصل الخامس 


ويتضمن الجيل الأول من 151 جميع المصطلحات الفريدة التي تم تحديدها في ا مجموعة 
(كأعمدة لها). باستثناء تلك الموجودة في قائمة التوقف؛ بالإضافة إلى جميع الوثائق (كصفوفها)؛ 
وعدد التكرارات لكل مصطلح لكل وثيقة (كقيم الخلية الخاصة بها). وكما هو شائع» فإن ا لمجموعة 
إذا تضمنت عددًا كبيرَا من الوثائق» فهناك فرصة جيدة جدًا لأن يتضمن نموذج 1101/1 عددًا Gus‏ 
ga í>‏ المصطلحات. وقد تستغرق معالجة مثل هذه المصفوفة الكبيرة وقنًا طويكاء والأهم من 
ذلك أنها قد تؤدي إلى استخراج أنماط غير دقيقة. وعند هذه النقطة يتعين على المرء أن يقرر ما يلي: 
lo (V)‏ هو أفضل تمثيل للمؤشرات؟ و(؟) كيف هكننا تقليل أبعاد هذه المصفوفة إلى حجم معقول؟ 

تمثيل ا مؤشرات: جرد أن تتم فهرسة وثائق الإدخال وتحويل ترددات الكلمة الأؤّلية (حعسب 
الوثيقة)» فإنه يمكن إجراء عدد من التحويلات الإضافية لتلخيص وتجميع المعلومات ا مستخرجة. 
وتعكس ترددات المصادر الخام عمومًا مدى بروز أو أهمية الكلمة في كل وثيقة. وبوجه خاص» 
فإن الكلمات ذات التكرار الأكبر في الوثيقة هي واصفات أفضل لمحتويات تلك الوثيقة. ومع 
ذلك فمن غير المعقول أن نفترض أن الكلمة تعد نفسها مناسبة مع أهميتها كواصفات للوثائق. 
Aias‏ إذا حدثت كلمة مرة واحدة في الوثيقة 4ء في حين أنها ف الوثيقة 8 حدثت ثلاث مرات» 
فليس من المعقول بالضرورة أن نستنتج أن هذه الكلمة هي ثلاثة أضعاف أهمية واصف الوثيقة 
8 مقارنة بالوثيقة 4. وللحصول على نظام 11034 أكثر اتسافًا لإجراء مزيد من التحليل» فيجب 
أولّا تطبيع هذه المؤشرات الأوّلية. وعلى عكس إظهار التعداد الفعلي للترددء فإنه يمكن تطبيع 
التمثيل العددي بين ا لمصطلحات والوثائق باستخدام عدد من الطرق البديلة» مثل ترددات السجل 
والترددات الثنائية وترددات الوثائق العكسية: وغيرها. 

تقليل أبعاد المصفوفة: نظرًا لأن نظام 11031 غالبًا ما يكون كبيرا جدًا ومتنائرًا إلى حد ما (معظم 
الخلايا مملوءة بالأصفار). فإن السؤال الآخر المهم هو «كيف هكننا تقليل أبعاد هذه المصفوفة إلى 
حجم معقول؟» حيث تتوفر العديد من الخيارات المتاحة لإدارة حجم المصفوفة. 
- يمر خبير المجال بقائمة المصطلحات ويزيل تلك التي لا معنى لها لسياق الدراسة (عملية يدوية 

تتطلب عمالة كثيرة). 

- إلغاء الشروط مع عدد قليل جدًّا من الظروف في عدد قليل جدًا من الوثائق. 
- تحويل المصفوفة باستخدام انحلال القيمة المغردة SVD‏ 

ويؤدي انحلال القيمة المفردة (575). والذي يرتبط ارتباطًا وثيقًا بتحليل المكونات الأساسية, 
إلى تقليل الأبعاد الإجمالية لمصفوفة الإدخال (عدد وثائق الإدخال حسب عدد ال مصطلحات 


tot‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


المستخرجة) إلى مساحة أصغرء حيث يمثل كل بُعد تالي أكبر درجة ممكنة من التقلبية (بين 
الدرجات والوثائنق) (1999 1126اتاء5 :8 عمنصصة]8). ومن الناحية المثالية» فإن ال لمحلل قد 
يحدد البعدين أو الثلاثة أبعاد الأبرز التي تمثل معظم التباين (الاختلافات) بين الكلمات والوثائقء 
وبالتالي تحديد المساحة الدلالية الكامنة التي تنظم الكلمات والوثائق في التحليل. وبمجرد تحديد 
هذه الأبعادء يتم استخراج ”المعنى“ الأساسي يلا هو موجود (تمت مناقشته أو وصفه) في الوثائق. 


المهمة ": استخراج المعرفة: 

حيث يتم استخراج أنماط جديدة في سياق المشكلة المحددة التي يتم تناولهاء باستخدام 
نموذج 11081 المنظم daa‏ والذي يمكن زيادته مع عناصر بيانات منظمة أخرى. أما الفئات 
الرئيسة لطرق استخلاص المعرفة فهي التصنيفء والتجميع؛ والاقتران» وتحليل الاتجاهات. وفيما 
يلي وصف موجز لهذه الطرق. 

التصنيف: ومكن القول أن أكثر موضوعات اكتشاف المعرفة شيوعًا في تحليل مصادر البيانات 
المعقدة هو تصنيف أشياء معينة. وتتمثل المهمة في تصنيف البيانات المعطاه إلى مجموعة من 
الفئات المحددة مسبقًا. كما أنه ينطبق على مجال التنقيب ف النص» حيث تُعرف المهمة باسم 
تصنيف النص. فبالنسبة لمجموعة معينة من الفئات (الموضوعات أو النقاط أو المفاهيم) ومجموعة 
من الوثائق النصية» فإن الهدف هو العثور على الموضوع الصحيح (الموضوع أو المفهوم subject‏ 
concept‏ 01) لكل وثيقة باستخدام النماذج التي تم تطويرها مع مجموعة بيانات التدريب التي 
تتضمن كلاً من الوثائق وفئات الوثائق الفعلية. واليوم يتم تطبيق تصنيف النص التلقائي في 
مجموعة متنوعة من السياقات» ها في ذلك فهرسة النص التلقائي أو شبه التلقائي (التفاعلي)» وتصفية 
الرسائل غير المرغوب فيهاء بالإضافة إلى تصنيف صفحات الويب ضمن كتالوجات هرمية» وتوليد 
lab‏ للبيانات الوصفية؛ واكتشاف النوع: فضلًا عن العديد من الأنواع الأخرى. 

وأما النهجان الرئيسان لتصنيف النصء فهما هندسة المعرفة وتعلم الآلة 
(Feldman & Sanger, 2007)‏ وباستخدام منهج هندسة المعرفة يتم ترميز معرفة الخبير حول 
الفنات في النظام إما بصورة عرضية أو في شكل قواعد تصنيف إجرائية. أما مع منهج تعلم الآلة, 
فإن العملية الاستقرائية العامة تبني مصنقًا من خلال التعلم من مجموعة من الامثلة المعاد 
تصنيفها. ومع زيادة عدد الوثائق بمعدل أسيء ومع ازدياد صعوبة معرفة خبراء المعرفة, فإن 
الاتجاه الأكثر انتشارًا بين الاثنين هو الاتجاه نحو نهج تعلم الآلة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £00 


الفصل الخامس 


التجميع: وهو عملية غير خاضعة للإشراف؛ حيث يتم تصنيف الكائنات إلى مجموعات 
«طبيعية» تسمى المجموعات: بالمقارنة مع التصنيف الذي يتم فيه استخدام مجموعة من الأمثلة 
التدريبية المصنفة مسبقًا لتطوير نموذج يعتمد على السمات الوصفية للفئات لتصنيف مثال 
جديد غير مذكور. آما في التجميع» فإن المشكلة تتمثل في تجميع مجموعة غير معلمة من الأشياء 
(مثل: الوثائق» والزبون» والتعليقات» وصفحات الويب) في مجموعات ذات مغزى دون أي معرفة 


مسبقة. 
ويُعد التجميع مفيدًا في نطاق واسع من التطبيقات؛ بدءًا من استرجاع الوثائق إلى تمكين 
عمليات بحث أفضل في محتوى الويب. وف الواقع» فإن أحد التطبيقات البارزة للتجميع هو 
التحليل والإبحار في مجموعات نصية كبيرة جدًاء مثل صفحات الويب. والافتراض الأساسي هو أن 
الوثائق ذات الصلة تميل إلى أن تكون أكثر تشابهًا مع بعضها البعض من غير التي ليس لها صلة 
بالموضوع. فإذا كان هذا الافتراض قائما فإن تجميع الوثائق اعتمادًا على تشابه محتواها يُحسّن 
فعالية البحث )2007 :(Feldman & Sanger,‏ 
- استرجاع بحث تم تحسينه: ولأن التجميع يستند إلى تشابه عام بدلا من وجود مصطلح واحد 
فإنه من الممكن أن يؤدي إلى تحسين استرجاع بحث معتمد على الاستعلام بطريقة تطابق 
استعلام وثيقة يمكن استرجاع ا مجموعة الكاملة منها. 
- تحسين دقة البحث: حيث هكن للتجميع أيصًا أن يحسن دقة البحث. فمع نمو عدد الوثائق في 
مجموعة: يصبح من الصعب استعراض قائمة الوثائق المطابقة. ويمكن أن يساعد التجميع على 
تجميع الوثائق في عدد من المجموعات الأصغر حجمًا من الوثائق ذات الصلة؛ وطلبها حسب 
الصلة وعرض الوثائق من المجموعة (أو المجموعات) الأكثر صلة. 
وأما الطريقتان الأكثر شيوعًا للتجميع فهما التجميع المبعثر / المجمع والتجميع الخاص 
بالاستعلام: 
- التجميع المبعثر: حيث يُستخدم التجميع كطريقة لتصفح الوثائق وذلك لتحسين كفاءة التصفح 
البشري للوثائق عندما لا يمكن صياغة استعلام بحث معينء بمعنى أن هذه الطريقة تقوم 
بشكل ديناميكي بإنشاء جدول محتويات لمجموعة وتقوم بتكيفها وتعديلها استجابةً لاختيار 
المستخدم. 
- التجميع الخاص بالاستعلام 1128ء]5ناك عقك6م011627-5: وتستخدم هذه الطريقة نهجًا 
تجميعيا للتملسل الهرمي حيث تظهر أكثر الوسائل ذات الصلة بالاستعلام المطروح في 


£01 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


مجموعات ضيقة صغيرة متداخلة في مجموعات أكبر تحتوي على وثائق أقل تشابهًاء مما 
يؤدي إلى وجود مجموعة من مستويات الملاءمة بين الوثائق. وتؤدي هذه الطريقة أداءً جيدًا 
ممجموعات الوثائق ذات الأحجام الكبيرة واقعيًا. 
الاقتران: وقد تم تقديم تعريف رسمي ووصف مفصل للاقتران في الفصل الخاص بالتنقيب 
في البيانات (الفصل الرابع). يعد تعليم الارتباط أو قواعد الارتباط في مجال التنقيب في البيانات 
أسلوبًا شائعًَا وبحنًا جيدًا لاكتشاف علاقات مثيرة للاهتمام بين المتغيرات في قواعد البيانات 
الكبيرة. وتتمثل الفكرة الرئيسة في إنشاء قواعد الارتباط (أو حل مشكلات سلة السوق) في تحديد 
المجموعات المتكررة التي تتماشثى معًا. 
وفي التنقيب في النصء يشير الارتباط تحديدًا إلى العلاقات المباشرة بين المفاهيم (المصطلحات) 
أو مجموعات المفاهيم. ويمكن تحديد مفهوم مجموعة قواعد القاعدة ۸+٤‏ المتعلقة بمجموعتي 
المفهوم المتكررتين .4 و0 بواسطة المقياسين الأساسيين للدعم والثقة. وفي هذه الحالةء فإن الثقة 
هي النسبة المئوية للوثائق التي تتضمن جميع المفاهيم في © داخل نفس ال مجموعة الفرعية من 
تلك الوثائق التي تتضمن جميع المفاهيم في .4. أما الدعم فهو النسبة (أو العدد) من الوثائق 
التي تتضمن جميع المفاهيم في 4. وعلى سبيل المثال» فقد يظهر في مجموعة الوثائق مفهوم 
”فشل تنفيذ البرامج“ غالبًا مقترنًا مع ”تخطيط موارد المؤسسة“ و”إدارة علاقات العملاء“ بدرجة 
دعم معنوي (6*) ومستوى ثقة (00*): وهذا يعني أن 6* من الوثائق كانت تشتمل على جميع 
المفاهيم الثلاثة ممثلة في نفس الوثيقةء والوثائق التي شملت ”فشل في تنفيذ البرامج“» 400 منها 
شملت أيضًا ”تخطيط موارد المؤسسات” و”إدارة علاقات العملاء“. 
وقد تم استخدام التنقيب في النص مع قواعد الاقتران لتحليل الأدبيات المنشورة (الأخبار 
والمقالات الأكاديمية المنشورة على الويب) لرسم تَفشَّي مرض أنفلونزا الطيور وتطوره Mahgoub)‏ 
وآخرونء .)7٠١8‏ كانت الفكرة هي تحديد الارتباط التلقائي بين المناطق الجغرافية» والانتشار عبر 
الأنواع والتدابير المضادة (العلاجات). 
تحليلات الاتجاه: تستند الأساليب الحديثة لتحليلات الاتجاه في مجال التنقيب في النص على 
فكرة أن أنواع مختلفة من توزيعات ال مفهوم هي وظائف مجموعات الوثائق» وهذا يعني أن 
مجموعات مختلفة تؤدي إلى توزيعات مختلفة للمفهوم لنفس مجموعة المفاهيم. ولذلك؛ فإنه من 
الممكن مقارنة التوزيعين اللذين يتطابقان بشكل ما إلا أنهما من توزيعات فرعية مختلفة. ويتمثل 
أحد الاتجاهات الملحوظة لهذا النوع من التحليل في وجود مجموعتين من نفس المصدر (على سبيل 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري tov‏ 


الفصل الخامس 


JUR‏ من نفس مجموعة الدوريات الأكاديمية) ولكن من نقاط زمنية مختلفة. وقد طبق كل من 
ae (e oL 23M JL ides (Y+ +A) Crossland g Delen‏ كبير من المقالات الأكادمية (المنشورة في 
المجلات الأكاديمية الثلاث الأعلى تصنيقًا) لتحديد تطور المفاهيم الأساسية في مجال نظم المعلومات. 
وكما هو موضح في هذا القسم» فإن هناك العديد من الطرق المتاحة للتنقيب في النص. وتصف 
الحالة العملية (0-0) استخدام عدد من التقنيات المختلفة في تحليل مجموعة كبيرة من الأدبيات. 
حالة عملية ه-ه 
مسح بحوث الأدبيات بالتنقيب في النص 
يواجه الباحثون الذين يجرون عمليات بحث واستعراض للأدبيات ذات الصلة مهمة 
معقدة وضخمة على نحو متزايد. وقد كان من المهم dawl Glo‏ بجد لجمع المعلومات 
الحالية من الأدبيات وتنظيمها وتحليلها واستيعابهاء من أجل توسيع نطاق المعرفة ذات 
الصلة. لا سيما من خلال الانضباط المنزلي. ومع تزايد وفرة الأبحاث الهامة المحتملة 
التي يتم الإبلاغ عنها في المجالات ذات ball‏ وحتى في المجالات التي تعتبر تقليديًا 
حقولًا غير مرتبطة بالدراسة: فإن مهمة الباحث تصبح أكثر صعوبة» إذا كانت هناك 
حاجة إلى عمل شامل. 
ds‏ تيارات البحث الجديدة. قد تكون مهمة الباحث أكثر ملا وتعقيدًا. ففي 
أحسن الأحوال» قد يكون من الصعب محاولة العثور على الأعمال ذات الصلة التي 
ذكرها الآخرونء بل وربما يكون شبه مستحيل إلى حد كبير إذا كانت هناك حاجة إلى 
مراجعات تقليدية» للأبحاث المنشورة. فحتى مع وجود مجموعة من طلاب الدراسات 
العليا المتفانين أو الزملاء المساعدين: فإن محاولة تغطية جميع الأعمال المنشورة ذات 
الصلة المحتملة هي إشكالية. 
وهناك العديد من المؤتمرات العلمية التي تُعقد كل عام: بالإضافة إلى توسيع نطاق 
المعرفة بالتركيز الحالي على المؤتمر حيث يرغب المنظمون في كثير من الأحيان في تقديم 
11185 وورش عمل إضافية. وفي العديد من الحالات. تهدف هذه الأحداث 
الإضافية إلى تعريف الحضور على تيارات بحث مهمة في مجالات الدراسة ذات الصلة 
ومحاولة تحديد ”الشيء الكبير التالي“ من حيث الاهتمامات البحثية والتركيز. وغاليًا ما 
يكون تحديد مواضيع المرشح المعقول بمثل هذه الثورات وورش العمل ذاتيًا بدلا من 
اشتقاق موضوعي من الأبحاث الحالية والناشئة. 


^£0 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


JS e 8l das dl)» $5‏ من 106165 و07055132) )٠١١8(‏ طريقة تساعد جهود 
الباحثين بشكل كبير وتعززها من خلال تمكين التحليل شبه الآلي للكميات الكبيرة من 
الأبحاث المنشورة من خلال تطبيق التنقيب في النص. وباستخدام المكتبات الرقمية 
القياسية ومحركات بحث النشر على الإنترنت» قاع المؤلفون بتنزيل وجمع جميع 
المقالات المتاحة للمجلات الثلاث الرئيسة في مجال نظم ال معلومات الإدارية: ©2115 
ربع السنوي »)115Q(‏ وبحوث نظم ا معلومات (18۸)» ومجلة نظم معلومات الإدارة 
(12/115). وللحفاظ على الفترة الزمنية نفسها لجميع المجلات الثلاث (للدراسات الطولية 
المقارنة المحتملة)» تم استخدام ا مجلة مع تاريخ البدء الأخير لتوفر النشر الرقمي كوقت 
بدء هذه الدراسة (أي أن مقالات 13/15 متوفرة رقميًا منذ »)۱۹۹١‏ بالنسبة لكل مقالة, 
حيث قاموا باستخلاص العنوان: والملخصء وقائمة المؤلفين» والكلمات المفتاحية المنشورة 
والحجم» ورقم الإصدارء وسنة النشرء ثم قاموا بتنزيل كل بيانات المقالة في ملف قاعدة 
بيانات بسيط. كما تم تضمينه في مجموعة البيانات المدمجة التي لها مجال مشترك. 
والذي يحدد نوع المجلة لكل مادة من أجل تحليل تمييزي محتمل. كما تم حذف 
ا لملاحظات التحريرية والملاحظات البحثية والنظرات العامة التنفيذية من ا مجموعة. 
يوضح الجدول التالي كيفية عرض البيانات بتنسيق جدولي. 

وقد اختاروا في مرحلة التحليل استخدام ملخص للمقالة فقط كمصدر لاستخراج 
المعلومات. كما اختاروا عدم تضمين الكلمات المفتاحية المدرجة في ا لمنشورات لسببين 
رئيسين: )١(‏ في ظل الظروف العادية» فإن ا لملخص سيش مل بالفعل الكلمات ال مفتاحية 
المدرجة: وبالتالي فإن إدراج الكلمات المفتاحية المدرجة للتحليل سيعني تكرار نفس 
المعلومات ويحتمل أن يمنحهم zÈ jg‏ مستحق» (۲) قد تكون الكلمات المفتاحية المدرجة 
عبارة عن كلمات يرغب المؤلفون في أن ترتبط مقالتهم بها (على عكس ما هو موجود فعلًا 
في المقالة)» وبالتالي قد يكون من المحتمل تقديم تحيز غير قابل للتحليل لتحليل المحتوى. 
ID‏ |العام | مجلة نبذة مختصرة 
الحاجة إلى ابتكار قيم مستمرة هي دفع سلاسل 
التوريد للتطور من 
على الرغم من أن الكثير من الأفكار ا معاصرة تعتبر 
تقنية المعلومات المتقدمة. 


MISQ| 2005 | PID001 





ISR |1999 | PID002 














3 | 2001 | 11/115 | عندما يواجه منتجو البضائع (أو الخدمات) وضكًا والذي ... 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £03 

















الفصل الخامس 


ID‏ |العام | مجلة نبذة مختصرة 
4 | 1995 | 1512 | أصبحت أهمية الحفاظ على الذاكرة التنظيمية مهمة ل... 


ail Icon‏ هنا هوا تكيف لتموقع قم تطويرة 
لقياس ... 


ISR |1994 | 5 


6 | 1995 | 211590 | تقيم هذه الدراسة مدى القيمة المضافة للعملاء من ... 
هذه الورقة هي تقارير لنتائج (-) من دراسة ميدانية 
لستة فرّق للمشروع الطبي ... 

98 | 1999 | 118115 | بدأ الباحثون والمديرون يدركون أن المزايا الكاملة .... 


MISQ| 2003 | PID007 


تقنيات التجارة عبر الإنترنت قد خفَّضْت إلى حد كبير 
g dodi cias JMIS | 2000 | PID009‏ 
نظرية التركيب التكيفية (451) أصبحت بسرعة 
نظرية مؤثرة. 

يظهر البحث أن نظم دعم المجموعة (655) قد زادت 
بشكل كبير. 

يطالب سير الأعمال بشكل متزايد بأن تلعب تقنية 
المعلومات دور الأعمال التجارية. 


ISR |1997 | PID0010 


JMIS | 1995 | PID0011 


MISQ | 2000 | PID0012 


من المعتقد على نطاق واسع أن التوافق بين إستراتيجية 
العمل وإستراتيجية 15. 


ISR | 2001 | PID0013 


تم توضيح إطار يتضمن تخطيط أهداف تقنية 
المعلومات وتحديدها. 


11115 | 1999 | 4 


5 1999 | 12/115 | الأهمية المتزايدة باستمرار لتقنية المعلومات (11) تتطلب ... 





6 | 1994 | 31150 | تحديد أفضل طريقة لتنظيم وظائف 15 داخل المؤسسة. 


PID0017‏ | 1996 | 151 | أسباب ردود الفعل المختلطة لتداول اليوم الإلكتروني غير التبادلي. 














98 19969 | 12115 | آثار الأداء لاستثمارات تقنية المعلومات في المنظمة. 


eve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





















































التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


ID‏ |العام | مجلة نبذة مختصرة 

عدم الكشف عن الهوية هو مفهوم أساسي في بحوث 
نظم دعم المجموعة (658). 

على الرغم من أن التجارة الإلكترونية (©8) قد خلقت 
فرضًا جديدة للعمل. 

61 2005 | 13115 | فهم الاعتماد الناجح لتقنية المعلومات إلى حد كبير. 
نظم تخطيط موارد المؤسسة ös lagts (ERP)‏ 
المعلومات المعقدة. 


JMIS | 1997 | PID0019 


ISR | 2002 | PID0020 


MISQ | 2005 | PID0022 





MIS | 1994 | PID0023‏ | نظم إدارة نموذج دعم نماذج في مختلف مراحل النموذج. 
بينما يتم التعرف على تدريب الحاسب على نطاق 
واسع باعتباره الحاسب الأساسي. 


ISR | 1995 | PID0024 











وقد كانت الدراسة الاستكشافية الأولى هي النظر في المنظور الطولي للمجلات الثلاث 
(أي تطوير موضوعات البحث بمرور الوقت). ومن أجل إجراء دراسة طوليةء قسموا فترة 
ال VY‏ سنة (من 1196 إلى 27٠٠0‏ إلى أربع فترات بحيث تكون كل فترة عبارة عن ثلاث 
سنوات لكل من المجلات الثلاث. وقد أدى هذا الإطار إلى Y‏ تجربة للتنقيب في النص 
مع ١١‏ مجموعة من البيانات الحصرية المتبادلة. عند هذه النقطة: وقد استخدمت 
كل مجموعة من مجموعات البيانات الاثنتي عشرة التنقيب في النص لاستخراج أكثر 
العبارات وصفية من هذه المجموعات من المقالات التي تمثلها ملخصاتهاء وتم جدولة 
النتائج وفحصها للتغييرات الزمنية المتغيرة في الشروط المنشورة في هذه المجلات الثلاث. 

وكاستكشاف ثانء باستخدام مجموعة البيانات الكاملة Le)‏ في ذلك المجلات الثلاث 
وجميع الفترات الأربع)» قاموا بإجراء تحليل للتجميع. ويمكن القول أن التجميع هو 
أكثر تقنيات معالجة النصوص استخدامًا. وقد تم استخدام التجميع في هذه الدراسة 
لتحديد المجموعات الطبيعية للمقالات (عن طريق وضعها في مجموعات منفصلة) ثم 
سرد أكثر العبارات وصفية التي ميزت تلك ال مجموعات. كما استخدموا 8۷2 لتقليل 
الأبعاد من مصفوفة الوثائق من قبلء ومن ثم خوارزمية تعظيم التوقعات لإنشاء 
التجمعات. وقد أجريت العديد من التجارب لتحديد العدد الأمثل للمجموعات» والتي 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 20[ 























الفصل الخامس 


تبين أنها تسعة. وبعد بناء التجمعات التسعة» قاموا بتحليل محتوى تلك المجموعات 
من منظورين: )١(‏ تمثيل نوع المجلة (انظر الشكل 5-0أ). (۲) تمثيل الوقت (الشكل 
5-/ب). وكانت الفكرة هي استكشاف الاختلافات المحتملة والقواسم المشتركة بين 
المجلات الثلاث والتغييرات المحتملة في التركيز على هذه المجموعات؛ أي للإجابة على 
أسئلة مثل: ”هل هناك مجموعات تمثل مواضيع بحث مختلفة خاصة بمجلة واحدة؟“ 
و ”هل هناك توصيف زمني متفاوت لهذه المجموعات؟“ اكتش فوا وناقشوا عدة اط 
مثيرة للاهتمام باستخدام تمثيل جدولي ورسوم بيانية من النتائج التي توصلوا إليها 
(وطمزيد من اممعلومات« انظر: 2008 .(Delen & Crossland,‏ 

أسئلة للمناقشة: 

-١‏ كيف يمكن استخدام التنقيب في النص لتسهيل المهمة التي لا يمكن التغلب عليها 
طراجعة الأبحاث المنشورة؟ 

'- ماهي النتائج الشائعة لمشروع التنقيب في النص لمجموعة محددة من مقالات 
الدوريات؟ وهل يمكنك التفكير في النتائج المحتملة الأخرى التي لم يتم ذكرها في هذه الحالة؟ 


ew‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 






































50 
s 
s 
BE يجح‎ fi 
s 
Msa ISR aus msa ISR ms 
rm eusten: € 
i TEEN 
5 
$ 
EE z : 
Wis ws as NC 
cummem. à cusmen: s 
wi en an ma en as 
CLUSTER: 7 CLUSTER: 2 
JOURNAL. 












































b Histogram of YEAR; categorized by CLUSTER 
چ‎ 
35 2: 
30 
25 
z 
2 
: 
1994 1996 1998 2000 2002 1994 1996 1998 2000 2002 2004 1994 1996 1998 2000 2002 
مو و و‎ 
CLUSTER: 3 CLUSTER- 8 CLUSTER: 6 
g 
35 
$ 
B cs 
z 
HE 
1 
Amasan imien - — 
1994 1996 1998 2000 2002 2004 1994 1996 1998 2000 2002 2004 1894 1996 1998 2000 2002 2004 
C a a a 
Ê med m 
S 
2 
x 
2 
20 
2 
10 
8 
8 1994 1996 1998 2000 2002 2004 1994 1996 1998 2000 2002 2004 1994 1996 1998 2000 2002 2004 
ل ا‎ OM 
STER EE imes 
Be. 





Source: Delen, D., & Crossland, M. (2008). Seeding the survey and analysis of research literature 
with text mining. Expert Systems with Applications, 34(3), 1707- 1720. 


الشكل 6-5: أ- توزيع عدد المقالات للمجلات الثلاث على المجموعات التسع 
ب- تطوير المجموعات التسع على مر السنين 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ew‏ 






























































الفصل الخامس 


أسئلة مراجعة على القسم 0-0: 
-١‏ ما هي الخطوات الرئيسة في عملية التنقيب في النص؟ 
۲- ما هو سبب اعتدال ترددات الكلمات؟ وما هي الطرق الشائعة لاعتدال ترددات الكلمات؟ 
“- ما هو 55172 وكيف يتم استخدامه في التنقيب في النص؟ 
ع- ما هي طرق استخراج المعرفة الأساسية من مجسم القوانين؟ 
٠-٥‏ تحليل المشاعر: 

نعتبر نحن البشر كائنات اجتماعية بارعة في الاستفادة من مجموعة متنوعة من وسائل 
التواصلء» وكثيرًا ما نتشاور مع منتديات المناقشة المالية قبل اتخاذ قرار الاستثمار؛ فنسأل أصدقاءنا 
عن آرائهم حول مظعم تم افتتاحه حديثًا أو فيلم تم إنتاجه حدينًا؛ كما نقوم بإجراء عمليات 
بحث على الإنترنت وقراءة تعليقات المستهلكين وتقارير الخبراء قبل إجراء عملية شراء كبيرة مثل 
منزل أو سيارة أو جهاز. ونحن نعتمد على آراء الآخرين لاتخاذ قرارات أفضلء خاصة في منطقة 
لا نملك فيها الكثير من المعرفة أو الخبرة. وبفضل تزايد توافر موارد الإنترنت الغنية بالرأي مثل 
وسائل التواصل الاجتماعي Twitter Jis)‏ وع001اء13) ومواقع المراجعة على الإنترنت وا مدونات 
الشخصية: أصبح الآن من السهل أكثر من أي وقت مض العثور على آراء الآخرين (الآلاف منهم» 
كما هو واقع الأمر) على كل شيء من أحدث الأدوات إلى الشخصيات السياسية والعامة. وعلى 
الرغم من عدم التعبير عن آراء عبر الإنترنت - بسبب الغالبية المتزايدة لعدد قنوات التواصل 
الاجتماعي وقدراتها - إلا أن الأرقام تتزايد بشكل كبير. ومن الصعب وضع تعريف محدد لكلمة 
المشاعرء حيث إنها غالبًا ما ترتبط ممصطلحات أخرى أو تختلط معها مثل الاعتقادء والرؤية 
والرأيء بالإضافة إلى القناعة. وتشير المشاعر إلى وجود رأي ثابت يعكس مشاعر المرء (,2/1©018 
9). وللمشاعر بعض الخصائص الفريدة التي تميزها عن المفاهيم الأخرى التي قد نرغب في 
تحديدها في النص. وغالبًا ما نرغب بتصنيف النص حسب الموضوع, والذي قد يتضمن التعامل 
مع تصنيفات كاملة للموضوعات. ومن ناحية أخرىء فعادةً ما يقوم تصنيف المشاعر بالتعامل 
مع فئتين (إيجابي مقابل سلبي)» أو نطاق من التناقض (على سبيل «JULI‏ تصنيف النجوم للأفلام)» 
أو حتى نطاق قوة الرأي (2008 ,861:66 8). وتمتد هذه الفئات لتشمل العديد من المواضيع 
وا لمستخدمين والوثائق. وعلى الرغم من أن التعامل مع فئات قليلة فقط قد يبدو مهمة أسهل 
من تحليل النص القياسيء إلا أن هذا أبعد ما يكون عن الحقيقة. 

وكمجال للبحثء OB‏ تحليل المشاعر يرتبط ارتباطًا وثيقًا باللسانيات الحاسوبية, معالجة اللغات 
الطبيعية 211:2 والتنقيب في النصوص. ولتحليل المشاعر العديد من الأسماء: وغالبًا ما يشار 


ew‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


إليه على أنه استخراج الرأيء وتحليل الذاتيةء واستخراج التقييم» مع بعض الاتصالات بالحوسبة 
العاطفية (التعرف على الحاسب والتعبير عن الانفعال). إن الاندفاع المفاجئ في الاهتمام والنشاط 
في مجال تحليل المشاعر (أي استخراج الرأي)» الذي يتناول الاستخراج التلقائي للآراء والمشاعر 
والدموقراطية في النصء ينتج فرضًا وتهديدات للشركات والأفراد على حد سواءء؛ ولن يستفيد منها 
سوى الأشخاص الذين يتقبلونها وينتفعون منها ... وسوف يتم اعتماد كل رأي يتم طرحه على 
الإنترنت من قبل فرد أو شركة إلى المنشئ (جيد أو سيئ) كما سيتم استرداده واستخراجه بواسطة 
الآخرين (غالبًا ما يتم تلقائيًا بواسطة برامج الحاسب). 

ويحاول تحليل المشاعر الإجابة عن السؤال التالي «ما الذي يشعر به الناس تجاه موضوع معين؟» 
عن طريق البحث في آراء الكثيرين باستخدام مجموعة متنوعة من الأدوات الآليةء وذلك من خلال 
الجمع بين الباحثين والممارسين في مجالات الأعمال وعلوم الحاسب واللغويات الحاسوبية والتنقيب في 
البيانات والتنقيب في النصوص بالإضافة إلى علم النفس وحتى علم الاجتماع. ويهدف تحليل المشاعر إلى 
توسيع نطاق تحليل النصوص القائم على الحقائق التقليدية إلى حدود جديدة لتحقيق نظم المعلومات 
الموجهة نحو الرأي العام. وفي إطار الأعمال التجارية خاصة في التسويق وإدارة علاقات العملاء يسعى 
تحليل المشاعر إلى الكشف عن الآراء الإيجابية وغيرها تجاه منتجات أو خدمات معينة باستخدام أعداد 
كبيرة من مصادر البيانات النصية (ملاحظات العملاء في شكل نشرات الويب» وتويت والمدونات» إلخ). 

ويأتي الشعور الذي يظهر في النص بصفتين مميزتين: كونه صريحًا؛ حيث تعر الجملة الشخصية 
مباشرة عن رأي (”إنه يوم رائع“)» كما أنه ضمنيّ؛ حيث يشير النص إلى رأي (”ينفصل المقبض بسهولة 
كبيرة»). وقد ركز معظم العمل السابق في تحليل المشاعر على النوع الأول من المشاعر لأنه أسهل في 
التحليل. أما الاتجاهات الحالية» فهي تنفيذ طرق تحليلية للنظر في المشاعر الضمنية والصريحة. إن 
تناقض المشاعر هي سمة خاصة للنص الذي يركز تحليل المشاعر في المقام الأول عليه» وعادةً ما يتم 
تقسيمها إلى قسمين: موجبة وسالبة» ولكن يمكن اعتبار الأقطاب Léo]‏ كنطاق. وسوف يعتري الوثيقة 
التي بها العديد من البيانات ا مرتقبة خلط في التناقض الكاملء وهو يختلف عن عدم وجود تناقض 
مطلقًا (كونها موضوعية؛ 2009 ,2/16[078). إن جمع وتحليل البيانات النصية في الوقت المناسب» 
والتي قد تأت من مجموعة متنوعة من المصادر - بدءًا من نسخ مراكز اتصال العملاء إلى منشورات 
وسائل التواصل الاجتماعي - تعد جزءًا هامًا من قدرات الشركات الاستباقية والتركيز على العملاء في 
الوقت الحاضرء وفي كثير من الأحيان يتم تصوير هذه التحليلات بشكل فوري للبيانات النصية في 
لوحات المعلومات سهلة الفهم. وتقدم الحالة العملية (1-0) قصة نجاح العميلء حيث يتم استخدام 
مجموعة من حلول التحليلات جماعيًا لتعزيز تجربة المشاهدين في بطولة ويمبلدون للتنس. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £10 


الفصل الخامس 


حالة عملية 1-0 


إنشاء تجربة رقمية فريدة لرصد اللحظات المهمة في وهبلدون 


ادمع عيبا ل 





وتُعرف ببساطة لملايين من المشجعين باسم «ويمبلدون», وهي أقدم بطولات التنس 
الأربع الكبرىء وهي واحدة من أرقى الأحداث الرياضية في العام وقد تم تنظيمها 
Ilg All England Lawn Tennis Club (AELTC) (536 (3 5s‏ يُعد مؤسسة 
رياضية وثقافية عالمية منذ عام /ا/141. 

بطل البطولات: 

إن منظمي بطولات ويمبلدونء 5 AELTCK‏ لديهم هدف بسيط: فهم يريدون 
استضافة أفضل بطولات التنس في العالم كل عام - بكل طريقة» وبكل مقياس. 

والدافع وراء هذا الالتزام ليس مجرد الكبرياء؛ كما أن لديها أساسًا تجاريًا. فقد تم بناء 
علامة وهبلدون (Wimbledon)‏ التجارية على مكانتها الرائدة. وهذا ما يجذب كلا من 
ا معجبين والشركاء. وتسعى أفضل المنظمات الإعلامية في العالم وأعظم الشركات - بما في ذلك 
1 - أن تكون مرتبطة مع ويمبلدون على وجه التحديد بسبب سمعتها للتميز. 

ولهذا السببء يعد الحفاظ على هيبة البطولة من أهم أولويات OSs AELTC‏ 
هناك طريقتان فقط يمكن أن تتحكم فيهما المنظمة مباشرة في كيفية النظر إلى بقية 
البطولات من قبل بقية العالم. 

الأولى والأكثر أهمية هي: توفير تجربة رائعة للاعبين والصحفيين والمتفرجين 
المحظوظين بما يكفي لزيارة ومراقبة ملعب التنس. وتتمتع 41510100 بخبرة كبيرة في 


£m‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


هذا امجال. ففي عام ۱۸۷۷ء أقامت منافسة مثيرة ورائعة على مدار أسبوعين في أجواء 
شاعرية: التنس في الريف الإنجليزي. 

والثانية هي: الحضور للبطولة عبر الإنترنت: والذي يتم تسليمه عبر موقع الويب 
31 وتطبيقات الجوال وقنوات التواصل الاجتماعي. وهذا التطور ا مستمر 
لهذه ا منصات الرقمية هو نتيجة شراكة مدتها ۲ عامًا بین A۴11٤‏ و18M.‏ 

;Mick Desmond e—55:5‏ ا مدير التجاري والإعلامي فی ۸۴1۲۴٥‏ قائلًا: «عندما 
تشاهد وهبلدون على التلفازء فإنك تشاهده من خلال عدسة ا مذيع. ونحن نفعل كل ما 
في وسعنا لمساعدة شركائنا في وسائل التواصل على تقديم أفضل عرض ممكن. ويختلف 
النظام الرقمي؛ فهو نظامنا الأساسي» حيث يكنا التحدث مباشرة مع ا معجبين لديناء لذلك 
فمن امهم أن نقدم لهم أفضل تجربة ممكنةء وإذا أردنا تعزيز علامتنا التجاريةء فنحن 
بحاجة إلى أن يشاهدوا تجربتنا الرقمية كمركز رقم واحد متابعة البطولة على الإنترنت"». 

ولذا؛ فقد استهدفت ۸۴11٥‏ جذب ۷۰ مليون زيارة» و١٠‏ مليون جهاز فريدء 
و۸ ملايين متابع خلال أسبوعين من بطولة 7١10‏ وكان الأمر متروكًا لشركتي IBM‏ 3 
٣‏ لإيجاد طريقة للتوصيل. 

نقل تجربة رقمية فريدة: 

شرعت 18M‏ و٣۸۴1۲‏ ف إعادة تصميم كاملة للمنصة الرقميةء وذلك باستخدام 
معرفتهم الوثيقة بجماهير البطولات بهدف تطوير تجربة مصممة خصيصًا لجذب 
مشجعي التنس من جميع أنحاء العام والإبقاء عليهم. 

تقول Alexandra Willis‏ رئيس قسم المحتوى الرقمي في 41:]:10: «لقد أدركنا 
أنه على الرغم من الأهمية المتزايدة للهاتف اممحمول» فإن ۸٠‏ من زوارنا يستخدمون 
أجهزة الحاسب ال مكتبية للوصول إلى موقعنا على الويب: وكان التحدي الذي واجهنا 
لعام ٠١10‏ هو كيفية تحديث خصائصنا الرقمية للتكيف مع عام متنقلء مع توفير 
أفضل تجربة ممكنة لسطح المكتب على الإطلاق. وقد أردنا لموقعنا الجديد أن يستفيد 
إلى أقصى حد من تلك الشاشة الكبيرة ويمنح مستخدمي سطح المكتب أغنى تجربة 
ممكنة فيما يتعلق بالمشاهد اطرتية ومحتوى الفيديو ع الي الوضوح - بينما يتفاعلون 
أيضًا ويتكيفون بسهولة مع أشكال الأجهزة اللوحية أو الهواتف المحمولة الأصغر». 

وتضیف: Gi»‏ ركزنا تركيرًً Ulle‏ على وضع محتوى في السياقء أي تكامل المقالات 
مع الصور ومقاطع الفيديو والإحصاءات ومقتطفات المعلومات ذات الصلةء وتبسيط 
التنقل بحيث يمكن للمستخدمين الانتقال بسلاسة إلى المحتوى الأكثر أهمية لهم». 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ew‏ 


الفصل الخامس 


وبالنسبة لأجهزة المحمول؛ فقد أدرك الفريق أن إتاحة اتصالات ©4 بسعة تحميلية عالية 
يعني أن موقع الويب للمحمول سيصبح أكثر شعبية من أي وقت مضىء كما سيضمن سهولة 
الوصول إلى جميع محتوى الوسائط الغنية. وفي الوقت نفسه» تم تحسين تطبيقات ا محمول 
في البطولات بإشعارات لنتائج المباريات في وقت حدوثهاء بل ويمكنها أيضًَا تقديم التحية 
للزوار أثناء مرورهم عبر المحطات في الطريق إلى الملاعب. 

كما قام الفريق ببناء مجموعة خاصة من المواقع الإلكترونية لأهم جماهير للعبة التنس» 
وهي اللاعبين أنفسهم؛ حيث قاموا - باستخدام تقنية Cug Gebs cly -*IBM "Bluemix‏ 
آمن يوفر للاعبين عرضًا شخصيًا لحجوزاتهم في الملعب, وتنقلاتهم: وأوقات اللعبء بالإضافة 
إلى مساعدتهم في مراجعة أدائهم بالوصول إلى إخصائيات كل مباراة لعبوها. 

تحويل البيانات إلى صورة مرئية - والصورة المرئية إلى قصة: 

ولتزويد منصاتها الرقمية با محتوى الأكثر إقناعًاء فقد استفاد الفريق من ميزة فريدة 
وهي وصوله إلى البيانات الخاصة بكل تسديدة في كل مباراة خلال البطولة في وقت حدوثها. 
وعلی مدار أسبوعين من بطولة وهبلدون» قام £A‏ خبيرًا تحكيميًا بجمع ما يقرب من 7,6 
مليون نقطة بيانات» وتتبع نوع اللقطة. والإستراتيجيات» ونتائج كل نقطة. 

ويتم جمع هذه البيانات وتحليلها في وقت حدوثها لإنتاج إحصاءات للعلقي التلفاز 
والصحفيين وكذلك لفريق التحرير الخاص بامنصة الرقمية. 

d$, Uzocs" :Alexandra Willis J9z5‏ 181/1 هذا العام ميزة لم نكن نملكها من 
قبلء وذلك باستخدام تقنية تدفق البيانات لتزويد فريق التحرير لدينا بنظرة فورية 
لامعا البارزة والأخبار العاجلة“. 

وتضيف: ”وقد راقب النظام تلقائيًا تيارات البيانات القادمة من جميع الملاعب 
التسعة عشرء وكلما حدث شيء مهم مثل تحقيق 610:8 573 لثاني أسرع خدمة في 
البطولات» يتم إخبارنا بذلك على الفور. وخلال ثوانٍء تمكنا من جلب هذه الأخبار إلى 
جمهورنا الرقمي ومشاركتها على الشبكات الاجتماعية لزيادة عدد الزيارات إلى موقعنا. 

”وقد كانت القدرة على التقاط اللحظات المهمة والكشف عن الروايات الصريحة 
في البيانات» بشكل أسرع من أي شخص آخرء أمرًا أساسيًا. فإذا كنت ترغب في تجربة 
انفعالات بطولة 5ومنط1186 116 فإن أفضل ما يمكن أن يكون موجودًا في شخص ما هو 
متابعة الحدث .“wimbledon.com de‏ 


EM‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


استغلال قوة اللغة الطبيعية: 

وقد خضعت للتجربة هذا العام قدرة أخرى. وهي استخدام تقنيات معالجة اللغات 
الطبيعية 7112 الخاصة بشركة 1834 وذلك للمساعدة في تطوير المكتبة الضخمة لتاريخ 
التنس في 4۴1۲٥‏ للحصول على معلومات ذات سياق جيد ومثيرة للاهتمام. وقد قام 
colsul ue IBM Watson " Engagement Advisor v» 4 (8: 4l‏ هذه ال مجموعة 
الغنية من البيانات غير الهيكلية واستخدامها للرد على الاستفسارات من ا لمكتب الصحفي. 

كما تم ربط نفس واجهة معالجة اللغات الطبيعية (771:5) أيضًا بقاعدة بيانات منظمة 
شاملة لإحصائيات المطابقة» والتي يعود تاريخها إلى أول بطولة والتي كانت عام ۱۸۷۷ء 
والذي يجيب بشكل فوري على كل من الأسئلة الأساسية والاستفسارات الأكثر تعقيدًا. 

يقول 0۸4ء٥2 :Mik‏ «وقد أظهرت تجربة ۷50١‏ قدرًَا كبر من الإمكانات. 
وفي العام القادم» وكجزء من عملية التخطيط السنوي للابتكار فإننا سننظر في كيفية 
استخدامنا لها على نطاق أوسع - حيث نسعى في النهاية إلى منح المعجبين فرصة أكبر 
للوصول إلى هذا المصدر الغني بمعلومات التنس بشكل مذهل». 

الارتقاء للسحاب: 

لقد تمت استضافة البيئة الرقمية بالكامل من قبل 183/1 في 11:14 0104© الخاص 
بها. حيث استخدمت 183/1 تقنيات النمذجة المتطورة للتنبؤ بالذروات في الطلب على 
أساس الجدول الزمني» وشعبية كل لاعب» والوقت من اليوم والعديد من العوامل 
الأخرى -مما مكنها من تخصيص موارد السحابة بشكل ديناميكي لكل جزء من ا محتوى 
الرقمي وضمان تجربة سلسة طلايين الزائرين حول العام. 

وبالإضافة إلى منصة السحابة الخاصة القوية التي دعمت البطولة لعدة سنوات» استخدمت 
1 أيضًا سحابة :3(:6:آ5016* المنفصلة لاستضافة مركز قيادة ويمبلدون الاجتماعي وأيضًا 
توفير سعة إضافية لتكميل بيئة السحابة الرئيسة خلال أوقات الذروة للطلب. 

وتعتبر مرونة بيئة السحابة أمرًا أساسيًا؛ نظرًا لأن المنصات الرقمية للبطولة تحتاج 
إلى أن تكون قادرة على التوسع بكفاءة من خلال عامل يزيد عن ٠٠١‏ في غضون أيام مع 
تزايد الفائدة قبل المباراة الأولى في الملعب الرئيس. 

المحافظة على وهبلدون آمنة ومُحْكَمَة: 

يُعد الأمان على الإنترنت هو مصدر القلق الرئيس في الوقت الحاضر لجميع 
ا لمنظمات. وبالنسبة للفعاليات الرياضية الكبرى على وجه الخصوصء» فإن سمعة 
العلامة التجارية هي كل شيء - وبينما يراقب العام» فإنه من المهم بشكل خاص تجنب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري e‏ 


الفصل الخامس 


الوقوع كضحية سهلة للجرهة الإلكترونية ٠«ذإء-إطرء.‏ ولهذه الأسباب» يلعب الأمان 
دورًا حيويًا في شراكة IBM‏ مع .AELTC‏ 

والجدير بالذكر أنه خلال الأشهر الخمسة الأولى من عام ۲١٠١‏ اكتشفت أنظمة أمان 
14 زيادة بنسبة 1٤‏ في الأحداث الأمنية على البنية التحتية 40۸.0 ۵اذ« مقارنة 
بالفترة نفسها من عام .۲١٠١‏ ونظرًا للتهديدات الأمنية - وخاصة هجمات الحرمان من 
الخدمة امموزعة (0008) - أصبحت 18M‏ أكثر انتشارًا بشكل مستمرء حيث تعمل على زيادة 
تركيزها من أجل توفير مستويات رائدة في صناعة الأمن للمنصة الرقمية الكاملة ل 4181:10. 

وقد مكنت مجموعة كاملة من منتجات /181 الأمنية: IBM QRadar* SIEM US à Le‏ 
IBM Preventia Intrusion Preventions‏ بطولة هذا العام من العمل بسلاسة وأمان» 
ومنصة رقمية لتقديم تجربة مستخدم عالية الجودة في جميع الأوقات. 

أسر القلوب والعقول: 

كان نجاح النظام الرقمي الجديد لعام 7٠١10‏ - بدعم من تقنيات سحابة 1821 
وتقنيات التحليلات وتقنيات الجوال وبالإضافة إلى التقنيات الاجتماعية والأمنية - فوريًا 
وكاملا. وم يتم تحقيق أهداف إجمالي الزيارات والزوار الفريدين فحسب» بل تم 
تجاوزها أيضًا. إن تحقيق /١‏ مليون زيارة و01 مليون مشاهدة من ١,١‏ مليون jlez‏ 
فريد من نوعه يُظهر نجاح المنصة في جذب جمهور أكبر من أي وقت مضىء وإبقاء 
هؤلاء المشاهدين مشاركين طوال البطولة. 

تقول 10711115 41632012: ”بشكل عام حققنا زيادة في الزيارات بنسبة #1١"‏ من 
أجهزة تجاوزت الأجهزة في عام ۲١٠٤‏ بنسبة ۲۳ء مقارنةً بعام 7015 وكان النمو في 
استخدام 113 على الجوّال أكثر إثارة للإعجاب“. وتضيف قائلة: ”لقد 
شهدنا نموًا بنسبة 170* في الأجهزة الفريدة على الجوّال ونموًا بنسبة 98 في إجمالي 
الزيارات ونمو بنسبة 2۷۹ في إجمالي عدد مشاهدات الصفحة“. 

ويختتم 4دهدروء2 M1)‏ قائلا: «تُظهر النتائج أنه في عام Y YO‏ فزنا في الاستحواذ 
على قلوب وعقول المشجعين. فقد يكون لدى الناس الصحف المفضلة ومواقع الويب 
الرياضية التي يزورونها ملدة 0٠‏ أسبوعًا من السنة - غير أنهم بدلا من ذلك قد جاءوا 
إلينا لمدة أسبوعينء وهذا دليل على الجودة المطلقة للتجربة التي يمكن أن نقدمها - 
واستغلال ميزاتنا الفريدة لجعلهم أقرب إلى العمل من أي قنوات تواصل أخرى. وقد 
ساعدت القدرة على التقاط وتوصيل المحتويات ذات الصلة فور وقوعها معجبينا على 
تحقيق مزيد من الاستمتاع بالبطولات أكثر من أي وقت مضى“. 


£v.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


أسئلة للمناقشة: 
-١‏ كيف استخدمت وهبلدون قدرات التحليلات لتعزيز تجربة المشاهدين؟ 
لا- ما هي التحديات والحل المقترح والنتائج التي حصلوا عليها؟ 
Source: IBM Case Study. Creating a unique digital experience to capture the‏ 


moments that matter. http://www-03.ibm.com/software/businesscasestudies/us/en/ 


corp?synkey-D140192K15783Q68 (accessed May 2016). 

تطبيقات تحليل المشاعر: 

بالمقارنة مع الأساليب التقليدية لتحليل المشاعرء والتي كانت تستند إلى مسح أو مجموعة 
تركيز مركزة ومكلفة وتستهلك الكثير من الوقت (وبالتالي مدفوعة من عينة صغيرة من المشاركين)» 
فإن الوجه الجديد لتحليل المشاعر القائم على تحليلات النصوص هو كاسر للحد. تعمل الحلول 
الحالية على جعل عمليات جمع البيانات وترشيحها وتصنيفها وتجميعها على نطاق واسع عملية 
AJT‏ وذلك عبر تقنية البرمجة معالجة اللغات الطبيعية 771:2 وتقنيات التنقيب في البيانات التي 
تتعامل مع كل من المعلومات الواقعية والذاتية. وقد يكون تحليل المشاعر التطبيق الأكثر شيوعًا 
لتحليلات النصوصء والاستفادة من مصادر البيانات مثل «Facebook o5; Ls «lao )2:Jl‏ 
وا مجتمعات على الإنترنت» ولوحات ال مناقشة» وسجلات الويب» ومراجعات المنتجات» وسجلات 
مركز الاتصال والتسجيلات» ومواقع تقييم ا منتجات» وغرف الدردشة» ومنافذ مقارنة الأسعار 
وسجلات محرك البحث ومجموعات الأخبار. وتهدف التطبيقات التالية لتحليل المشاعر إلى 
توضيح القوة والتغطية الواسعة لهذه التقنية. 

صوت العميل (©10): يعتبر صوت العميل (©1©0) جزءًا لا يتجزأ من أنظمة إدارة علاقات 
العملاء التحليلية 1031© وأنظمة إدارة العملاء. وباعتبار تحليل المشاعر أداة تمكين ل ©2570 
فإنه يمكن لتحليل المشاعر الوصول إلى مراجعات منتجات وخدمات الشركة (سواء بشكل مستمر 
أو بشكل دوري) لفهم وإدارة شكاوى العملاء ومدحهم بشكل أفضل. فعلى سبيل JUL‏ قد 
تكتشف شركة إعلانات / تسويق» صورًا متحركة أو مشاعر سلبية تجاه فيلم على وشك الافتتاح في 
المسارح (استنادًا إلى مقطوراتها 211655:]): وتقوم بتغيير تركيبة المقطورات 3l ial s trailers‏ 
الإعلان بسرعة (على جميع وسائل التواصل) للتخفيف من تأثير السلبية. وبالمثل: يمكن لشركة 
برمجيات أن تكتشف الطنين السلبي فيما يتعلق بالثغرات الموجودة في منتجها الذي تم إطلاقه 
حديثًا في وقت مبكر بما فيه الكفاية؛ لإصدار رقع وتصحيحات سريعة للتخفيف من حدة الموقف. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £V!‏ 


الفصل الخامس 


وفي كثير من الأحيانء يكون تركيز صوت العميل )۷0٥(‏ على العملاء الأفرادء واحتياجاتهم 
المتعلقة بالخدمات والدعم ورغباتهم ومشكلاتهم. ويقوم ۷0٥‏ بتجميع البيانات من المجموعة 
الكاملة لنقاط اتصال العملاء ما في ذلك رسائل البريد الإلكتروني والاستطلاعات وتسجيلات مركز 
الاتصال / التسجيلات» وترحيل وسائل التواصل الاجتماعي» ومطابقة أصوات العملاء مع المعاملات 
(الاستفسارات والمشتريات والعوائد)» والملفات الشخصية للعملاء الفردية التي تم التقاطها في 
مؤسسة أنظمة التشغيل. ويُعد ©5”06 والتي يقوم تحليل المشاعر بقيادتهاء عنصرًا أساسيًا في 
مبادرات إدارة تجربة العملاءء والذي يمثل الهدف في إنشاء علاقة ودية مع العميل. 

صوت السوق VOM sgt (VOM)‏ حول فهم الآراء والاتجاهات المجمعة. فهي تتعلق 
بمعرفة ماهية أصحاب المصلحة - العملاء. العملاء المحتملينء المؤثرين؛ أيَّا كان - بشأن منتجاتك 
وخدماتك (ومنافسيك). ويساعد تحليل 1021 - الذي يتم إجراؤه جيدًا - الشركات على تطوير 
الذكاء التنافسي وتطوير المنتجات ووضعها. 

صوت الموظف (015؟1): كان 10178 تقليديًا يقتصر على دراسة رضا الموظفين. وتُعد تحليلات 
النص بشكل عام (وتحليل المشاعر على وجه VOE gåt Dus ÉS (uogas‏ كما يعد استخدام 
البيانات النصية الغنية المعتمدة على الرأي طريقة فعالة وكفء للاستماع إلى ما يقوله الموظفون. 
deraz olz Ss‏ فإن الموظفين السعداء يعملون على تمكين جهود تجربة العملاء وتحسين رضاهم. 

إدارة العلامات التجارية: تركز إدارة العلامة التجارية على الاستماع إلى وسائل التواصل 
الاجتماعي. حيث يمكن لأي شخص (العملاء السابقين / الحاليين / المحتملين» وخبراء الصناعة, 
والسلطات الأخرى) نشر الآراء التي يمكن أن تضر بسمعتك أو تعززها. ويقدم عدد من الشركات 
المبتدئة التي تم إطلاقها حدينًا خدمات إدارة العلامات التجارية القائمة على التحليلات للآخرين. 
وتعد إدارة العلامة التجارية هي المنتج» والشركة (بدلًا من العملاء) هي التي تركز عليها. فهي 
تحاول تشكيل المفاهيم بدلا من إدارة الخبرات باستخدام تقنيات تحليل المشاعر. 

الأسواق AIUI‏ كان التنبؤ بالقيم المستقبلية للأفراد (أو مجموعة من الأسهم) مشكلة مثيرة 
للاهتمام ويبدو أنها غير قابلة للحل. وما يجعل السهم (أو مجموعة من الأسهم) يتحرك صعودًا 
أو هبوطًا هو أي شيء غير أنه يتطلب إدراك دقيق. ويعتقد الكثيرون أن سوق الأسهم مدفوعة 
في معظمها بالمشاعرء مما يجعلها غير عقلانية (خاصة بالنسبة لحركات الأسهم قصيرة الأجل). 
ولذلك؛ فقد اكتسب استخدام تحليل المشاعر في الأسواق المالية شعبية كبيرة. ويبدو التحليل الآلي 
ليل السوق باستخدام وسائل التواصل الاجتماعي والأخبار وا لمدونات ومجموعات النقاش طريقة 
مناسبة لحساب تحركات السوق. فإذا تم ذلك بشكل صحيح. فإنه يمكن أن يحدد تحليل المشاعر 
تحركات الأسهم قصيرة الأجل بناءً على الضجة ف السوق» مما قد يؤثر على السيولة والتداول. 
evy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


السياسة: كما نعلم جميعًاء فإن الآراء مهمة للغاية في السياسة. ونظرًا لأن النقاشات السياسية 
تهيمن عليها الاقتباسات والسخرية والإشارات المعقدة للأشخاص والمنظمات والأفكارء فإن السياسة 
هي واحدة من أصعب المجالات التي يمكن أن تكون مثمرة لتحليل المشاعر. ومن خلال تحليل 
المشاعر في المنتديات الانتخابيةء يمكن للمرء أن يتوقع من هو أكثر احتمالًا للفوز أو الخسارة. كما 
يمكن أن يساعد تحليل المشاعر في فهم ما يفكر فيه الناخبون ويمكنه توضيح موقف المرشح بشأن 
القضايا. وبالإضافة إلى ما سبق» فإن تحليل المشاعر يمكنه أن يساعد المنظمات السياسية والحملات 
ومحللي الأخبار على فهم أفضل للقضايا والمواقف الأكثر أهمية بالنسبة للناخبين. وقد تم تطبيق 
التقنية بنجاح من قبل كلا الطرفين في الحملات الانتخابية الرئاسية الأمريكية لعامي "٠١8‏ و117١7.‏ 

المخابرات الحكومية: المخابرات الحكومية هي تطبيق آخر تم استخدامه من قبل وكالات 
المخابرات. فعلى سبيل المثالء تم اقتراح إمكانية مراقبة مصادر الزيادة في الاتصالات العدائية أو 
السلبية. ويمكن لتحليل المشاعر أن يسمح بالتحليل التلقائي للآراء التي يقدمها الأشخاص حول 
مقترحات السياسات أو التنظيم الحكومي اممعلقة. وعلاوةً على ذلك فقد تكون مراقبة الاتصالات 
لاكتشاف ارتفاع المشاعر السلبية مفيدة لوكالات مثل وزارة الأمن الداخلي. 

مجالات أخرى مثيرة للاهتمام: يمكن استخدام مشاعر العملاء لتصميم مواقع التجارة الإلكترونية 
بشكل أفضل (اقتراحات المنتجء الإعلان عن البيع / البيع المتقاطع)؛ ووضع الإعلانات في مكان أفضل 
(مثل: وضع إعلانات ديناميكية للمنتجات والخدمات التي تنظر في المشاعر في الصفحة التي يقوم 
المستخدم بتصفحها)» وإدارة الرأي أو مراجعة محركات البحث الموجه (أي موقع ويب لتجميع 
clI‏ كبديل لمواقع مثل 121025ام: وتلخيص ملاحظات المستخدمين). ويمكن أن يساعد تحليل 
المشاعر على تصفية البريد الإلكتروني من خلال تصنيف وترتيب الرسائل حسب أولوياتها (فمثلًاه يمكنه 
اكتشاف رسائل البريد الإلكتروني السلبية وإرسالها إلى مجلد مناسب)ء بالإضافة إلى تحليل الاقتباس» 
حيث يمكنه تحديد ما إذا كان المؤلف يستشهد بجزء من العمل كدليل دامغ أو بحث مرفوض. 
عملية تحليل المشاعر: 

لا توجد عملية قياسية متاحة بسهولة لإجراء تحليل المشاعرء وذلك بسبب تعقيد المشكلة 
(المفاهيم الأساسية» التعبيرات في النص السياق الذي يتم فيه التعبير عن النص» إلخ). ومع ذلك 
de Flug‏ العمل المنشور في مجال تحليل الحساسية حتى الآن s JS ue)‏ طرق البحث ومجموعة 
التطبيقات)» فإن العملية تبدو متعددة النقاط وبسيطة ومنطقية. وكما هو موضح في الشكل (5-0): 
والذي هو عبارة عن منهجية مناسبة لتحليل المشاعرء فإن هذه الخطوات المنطقية تكرارية (أي ردود 
الفعل» التصحيحات, التكرارات هي جزء من عملية الاكتشاف) وتجريبية في الطبيعة» وبمجرد الانتهاء 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري لاع 


الفصل الخامس 


من الجمع والتركيب» فإنها تكون قادرة على إنتاج البصيرة المرغوبة حول الآراء في مجموعة النص. 

- الخطوة -١‏ الكشف عن المشاعر: بعد استرجاع الوثائق النصية وإعدادهاء فإن المهمة الرئيسة 
الأولى في تحليل الحساسية هي الكشف عن الموضوعية. والهدف هنا هو التفريق بين الحقيقة 
والرأيء والتي يمكن اعتبارها تصنيف نصٍ موضوعي أو ذاتي. كما يمكن تمييزها بحساب 0-5 
Objectivity Z egal)‏ - تناقض اوو Subjectivity Polarity‏ والتى يمكن تمثيلها 
بقيمة رقمية تتراوح من ٠‏ إلى .)١‏ فإذا كانت قيمة الموضوعية قريبة من ١‏ فلا يوجد رأي لي 
gl)‏ أنها حقيقة)؛ ولذلك ترجع العملية وتستخرج البيانات التالية للنض لتحليلها. k Šole‏ 
يستند اكتشاف الرأي على دراسة الصفات في النص. فعلى سبيل المثال: يمكن تحديد تناقض ”ما 
يعد عملا رائعًا“ بسهولة نسبية بالنظر إلى الصفة. 

- الخطوة ؟- تصنيف التناقض 71-8: المهمة الرئيسة الثانية هي تصنيف التناقض. وبالنظر إلى 
نص معين برأي quia‏ فإن الهدف هو تصنيف الرأي على أنه يندرج تحت إحدى عاطفتين 
متعارضتين: أو تحديد موقعه على الدوام بين هاتين المتناقضتين (2008 (Pang & Lee,‏ فعند 
النظر إليه على أنه عنصر ثنائيء فإن تصنيف الأقطاب هو مهمة التصنيف الثنائي لوضع علامة 
على وثيقة الرأي كإعراب إما عن رأي إيجابي شامل أو سلبي شامل (مثل: الإعجاب أو الإبهام). 
وبالإضافة إلى تحديد تناقض 71-8 فإنه يجب أيضًا أن يكون المرء مهتمًا بتحديد قوة المشاعر 
(على عكس الإيجابي فقط قد يتم التعبير عنه على أنه أقل من المعتاد mildly‏ أو معتدل 
moderately‏ 9 455-3 أو إيجابي للغاية). وقد تم إجراء معظم هذا البحث حول مراجعات 
المنتجات أو الأفلام حيث تكون تعريفات ”الإيجابية“ و“السلبية“ واضحة تمامًا. وهناك بعض 
المهام الأخرىء مثل تصنيف الأخبار على أنها ”جيدة“ أو ”سيئة“. فعلى سبيل المثالء قد تحتوي 
إحدى اللقالات على أخبار سلبية بدون استخدام أي كلمات أو عبارات ذاتية بشكل صريح. 
علاوةً على ذلكء تظهر هذه الفئات عادةًَ مختلطة عندما تعبر الوثيقة عن المشاعر الإيجابية 
والسلبية. وعندئذ. فإن هذه المهمة يمكنها تحديد المشاعر الرئيسة (أو المسيطرة) للوثيقة. 
ومع ذلكء فإنه بالنسبة للنصوص المطولة» قد يلزم القيام بمهام التصنيف على عدة مستويات: 
المصطلح. العبارةء الجملة» وربما مستوى الوثيقة. وبالنسبة لهؤلاء» فإنه من الشائع استخدام 
مخرجات مستوى واحد كمدخلات للطبقة الأعلى التالية. وفي القسم التالي سوف نتناول شرح 
العديد من الطرق المستخدمة لتحديد التناقض وكذلك أوجه القوة في التناقض. 

- الخطوة *- تحديد الهدف: الهدف من هذه الخطوة هو تحديد هدف المشاعر ia lge Aall‏ 
(على سبيل ال مثال: شخصء» (D> gi‏ وتعتمد صعوبة هذه المهمة بشكل كبير على مجال 
التحليل. وعلى الرغم من أنه من السهل عادةً تحديد الهدف بدقة لمراجعات المنتج أو الفيلم 


eve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


نظرًا لأن المراجعة مرتبطة مباشرة بالهدفء فقد يكون الأمر صعبًا جدًا في النطاقات الأخرى. فعلى 
سبيل المثالء لا يحتوي النص طويل الأمد. مثل صفحات الويب والمقالات الإخبارية وا مدوّنات داعا 
على موضوع محدد مسبقًا تم تعيينه» وكثيرا ما يذكر العديد من الموضوعات» والتي يمكن استنتاج 
أي منها على أنه الهدف. وفي بعض الأحيان يكون هناك أكثر من هدف واحد في جملة coe AL‏ 
وهذا هو الحال في النصوص اللقارنة؛ حيث تقوم جملة نسبية ذاتية بطلب الأشياء حسب ترتيب 
التفضيل - مثل: ”هذا الحاسب المحمول أفضل من الحاسب المكتبي الخاص بي“. ويمكن تحديد 
هذه الجمل باستخدام الصفات والحالات المقارنة (أكثر. أقلء أفضلء أطول)» والصفات الفائقة 
(معظم» والأقل والأفضل)ء وغيرها من الكلمات (مثل: نفس الشيء اختلف, (LÉS J‏ وبمجرد 
استرداد الجملء يمكن وضع الأشياء بترتيب أكثر تمثيلًا لمزاياهاء كما هو موضح في النص. 

- الخطوة 6- الجمع والتجميع: بمجرد تحديد ومعالجة مشاعر جميع نقاط البيانات النصية في 
الوثيقة: يتم تجميعها وتحويلها في هذه الخطوة إلى قياس واحد لكل الوثيقة. وقد يكون هذا 
التجميع بسيطًا مثل تلخيص نقاط الضعف ونقاط القوة لكل النصوصء أو معقدًا مثل استخدام 
تقنيات التجميع الدلالي من معالجة اللغات الطبيعية 771:5 للوصول إلى المشاعر النهائية. 














خطوة4» 
جدولة وتجميع نتاتج 
تحليل المشاعر 











شكل :٩-٥‏ عملية متعددة الخطوات لتحليل المشاعر 
ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري evo‏ 














الفصل الخامس 


طرق تحديد التناقض: 
كما ذكرنا في القسم السابقء يمكن تحديد التناقض على مستوى الكلمة أو العبارة أو الجملة 
أو الوثيقة. ويُعد المستوى الأكثر دقة لتحديد التناقض هو على مستوى الكلمة. وبمجرد أن يتم 
تحديد التناقض على مستوى الكلمةء فإنه يمكن ضمها إلى المستوى الأعلى التاليء ثم إلى ا مستوى 
التالي حتى يتم الوصول إلى مستوى التجميع المطلوب من تحليل المشاعر. ويبدو أن هناك تقنيتين 
سائدتين تُستخدمان لتحديد التناقض على مستوى الكلمة / المصطلح: ولكل منهما مميزاته وعيوبه: 
-١‏ استخدام المعجم كمكتبة مرجعية (ويتم تطويره إما la als) lab sl suo‏ فرد لمهمة 
محددة أو قد يتم تطويره بواسطة مؤسسة للاستخدام العام). 
؟- استخدام مجموعة من وثائق التدريب كمصدر للمعرفة حول تناقض ال مصطلحات في نطاق 
معين (أي استحداث نماذج تنبؤية من الوثائق النصية المعترف بها). 


استخدام المعجم: 

المعجم هو في الأساس كتالوج لكلمات لغة معينة ومرادفاتها ومعانيها. وهناك العديد من 
المعاجم ذات الأغراض العامة التي تم إنشاؤها للغة الإنجليزية» بالإضافة إلى وجود معاجم للعديد 
من اللغات الأخرى. وتستخدم معاجم الأغراض العامة في الغالب لإنشاء مجموعة متنوعة من 
المعاجم ذات الأغراض الخاصة لاستخدامها في مشاريع تحليل المشاعر. ولعل المعجم الأكثر 
انتشارًا للأغراض العامة هو ۷0۲4۸6 Princeton à slz (à o5L 25! 3 (sls‏ والذي تم 
توسعته واستخدامه من قبل العديد من الباحثين والممارسين لأغراض تحليل المشاعر. وكما هو 
موضح في موقع (wordnet.princeton.edu) cog)! de WordNet‏ 94 قاعدة معجمية كبيرة 
للغة الإنجليزيةء ا في ذلك الأمسماء والأفعال والصفات والظروفء والتي تم ضمها في مجموعات 
من المرادفات المقربة (ويطلق عليها (synsets‏ والتي يعبر كل منها عن مفهوم متميز. وتترابط 
95 عن طريق وسائل مفاهيمية دلالية وعلاقات معجمية. 

وقد تم إنشاء ملحق مثير للاهتمام فعجم Sebastianig Esuli ةؤطwlgıب WordNet‏ )2006( 
حيث قاما بإضافة تناقض (إيجابي - سلبي؛ 8-17) وموضوعية (ذاتي - موضوعي؛ JS (S-O‏ 
مصطلح في ا معجم. ولتسمية كل مصطلح» يقومان بتصنيف المجموعة من المترادفات التي ينتمي 
إليها هذا المصطلح باستخدام مجموعة ثلاثية التصنيف (وهي مقياس يربط كل موضوع تمامًا 
واحدًا من ثلاثة عناوين)» وكل واحد منهم قادر على تقرير ما إذا كانت 5[72564 إيجابية أم سلبية 


evi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


أم موضوعية. وتتراوح الدرجات الناتجة من ٠.١‏ إلى ٠.١‏ مما يعطي تقييمًا متدرجًا لخصائص 
المصطلحات المتعلقة بالرأي. ويمكن تلخيصها بصورة مرئية كما في الشكل .)٠١-0(‏ وتمثل أضلاع 
ا مثلث التصنيفات الثلاثة (الإيجابية والسلبية والموضوعية). ويمكن أن يتم تحديد موقع ا لمصطلح 
في هذه المساحة كنقطةء تمثل المدى الذي ينتمي إليه كل واحد من هذه التصنيفات. 


ويتم استخدام منهجية توسيع مماثلة لإنشاء SentiWordNet‏ وهو معجم متاح للجمهور 
تم تطويره خصيصًا لأغراض التنقيب ف الرأي (تحليل اممشاعر). ويُعيّن SentiWordNet‏ لكل 
مجموعة من الدرجات الثلاث من معنويات ا4۸6إ۷0: الإيجابية والسلبية وامموضوعية. وهمكن 
الاطلاع على المزيد .sentiwordnet.isti.cnr.it $ SentiWordNet Js‏ 

وهناك ملحق آخر ل .WordNet-Affect sa WordNet‏ وقد تم تطویره بواسطة کل من 
Valituttis Strapparava‏ )2004( حیث قاما بتصنیف معادلات ۷0۲4۸٩‏ باستخدام تسمیات 
فعالة تمثل فئات عاطفية مختلفة Jis‏ العاطفة والحالة الإدراكية والموقف والشعور. كما استخدما 
+011 أيضًا بشكل مباشر في تحليل المشاعر. فمثلًا Hovys Kim (ys JS el‏ )3«(2004 
Chengs Hus Liu‏ (2005) بتطوير معاجم للمصطلحات الإيجابية والسلبية من خلال البدء 
بقائمة صغيرة من مصطلحات ”البذور“ للمترادفات المتعارف عليها (مثل: »107 (nice, like,‏ وبعد 
ذلك استخدما خاصيتي تضاد وترادف المصطلحات لتجميعها في أي فئة من فئات التناقض. 
GS 0 |‏ | 








| موضوعي (0) 
شكل :٠١-0‏ تمثيل بياني لعلاقتي تناقض كل من 2-17 و5-0 
استخدام مجموعة من وثائق التدريب: 
من الممكن إجراء تصنيف للمشاعر باستخدام التحليل الإحصاني وأدوات التعليم الآلي التي 
تتمتع بميزة كمية ال موارد الضخمة من الوثائق المتاحة (يدويًا عن طريق الحواشي أو باستخدام 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري EW‏ 





الفصل الخامس 


نظام نجمة / نقطة). وقد تم استخدام مواقع الويب مثل 2201 A»ء‏ 9 «eBays .C-NET‏ 3 
[nternet Movie Database «Rotten Tomatoes‏ على نطاق واسع كمصادر للبيانات ا مشروحة, 
من أجل استعراض المنتجات. ويوفر نظام النجمة (أو الطماطم سابقًا) علامة واضحة عن التناقض 
الكامل في الاستعراض ككلء وغالبًا ما يتم استخدامه كمعيار ذهبي لتقييم الخوارزمية. 
وتتوفر مجموعة متنوعة من البيانات النصية المصنفة يدويًا من خلال جهود التقييم مثل مؤتمر 
RETRIETER‏ وCollection‏ 1656 2111 لأنظمة 4112 وعبر منتدى تقييم اللغات. وتنتج هذه 
المجموعة من البيانات جهودًا غالبًا ما تكون بمثابة معيار في مجتمع التنقيب في النص. بما في ذلك 
لباحثي تحليل المشاعر. كما أنتج الباحثون الفرديون ومجموعات البحث العديد من مجموعات 
البيانات المثيرة. وتعرض الفكرة التطبيقية )١-١(‏ قائمة ببعضها. وبمجرد الحصول على مجموعة 
بيانات نصية مصنفة بالفعل فإنه يمكن استخدام مجموعة متنوعة من النمذجة التنبؤية وغيرها 
من خوارزميات تعلم الآلة لتدريب مصنقي المعنويات. وتتضمن بعض الخوارزميات الأكثر شيوعًا 
المستخدمة لهذه المهمة الشبكات العصبية الاصطناعية: وآلة المتجهات الداعمة: والجار الأقرب» 
والخلايا البسيطة؛ وأشجار القرارء وتعظيم التقديرات على أساس المجموعة. 
d$;‏ فنية ٠-٠‏ 
مجموعات بيانات نصية كبيرة للتنقيب التنبؤي في النص وتحليل المشاعر 
نصوص الكونغرس حول 1100:7-1060866: نشرها كل من 1102225 Lees Pangs‏ 
(2006)؛ وتحتوي على خطابات سياسية تم تصنيفها لتوضيح ما إذا كان المتحدث يدعم 
أو يعارض التشريع الذي تمت مناقشته. 
8 نشرتها مدرسة å Stern‏ جامعة نيويورك: وتتكون من تعقيبات 
-Amazon.com ($ jJ‏ 
مجموعات بيانات عرض الأفلام من *(Lee 2008) 5 Pang JS L.4248 485 :Cornell‏ 
وتحتوي على ٠٠٠١‏ تصنيف إيجابي و١٠٠٠‏ تصنيف تلقائي سلبي مشتقة من عناوين مستوى 
الوثيقة و0701 جملة / قُصاصة إيجابية و0781 جملة / قصاصة سلبية. 
ستانفورد - مجموعة كبيرة لعرض الأفلام: وهي مجموعة من ۲٠٠٠١‏ فيلم شديدة 
التناقض تتم مراجعتها للتدريب و٠٠٠٠۲‏ للاختبار. ويوجد بيانات إضافية للاستخدام 
بدون عنوان. كما يتم توفير تنسيقات للنصوص الخام وحقائب الكلمات المعالجة 
-(http://ai.stanford.edu/-amaas/data/sentiment : 4l) Ae‏ 


EVA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


مجموعة 81504: تحتوي المجموعة ونظام استطلاع الرأي على 010 مقالًا إخباريًا 
مشروحة يدويًا من مجموعة متنوعة من مصادر الأخبار التي تحتوي على عناوين للأراء 
والتصريحات الخاصة (المعتقدات: العواطفء المضاربات» إلخ). 

عروض مطاعم متعددة الجوانب: وقام بعرضها كل من Barzilay s Snyder‏ )2007(: 
وتحتوي على ٤٤٨٨‏ مراجعة مع تقييم صريح من ١‏ إلى 4 لخمسة جوانب مختلفة: الطعام 
والجو والخدمة والقيمة بالإضافة إلى الخبرة العامة. 


تحديد الاتجاه الدلالي للجمل والعبارات: 

مجرد تحديد الاتجاه الدلالي للكلمات الفرديةء فمن المستحسن في كثير من الأحيان تمديد 
ذلك إلى العبارة أو الجملة التي تظهر بها الكلمة. وأبسط طريقة لتحقيق هذا التجميع هي 
استخدام نوع من المتوسط لاستقطاب الكلمات في العبارات أو الجمل. وعلى الرغم من أنه نادرًا 
ما يتم تطبيقه» إلا أن هذا التجميع يمكن أن يكون معقدًا مثل استخدام واحد أو أكثر من تقنيات 
تعلم الآلة لإنشاء علاقة تنبؤية بين الكلمات (وقيم تناقضها) والعبارات أو الجمل. 


تحديد الاتجاه الدلالي للوثائق: 

على الرغم من أن الغالبية العظمى من العمل في هذا ا مجال تتم في تحديد التوجه الدلالي للكلمات 
والعبارات / الجمل: فإن بعض الم مهام مثل التلخيص واسترجاع ا معلومات قد تتطلب وضع العلامات 
الدلالية للوثيقة بأكملها (عة٠ه۸‏ وآخرونء 4+ (Y+‏ ويتم أيضًا تحقيق التجميع إلى مستوى الوثيقة 
بواسطة نوع من المتوسطء على غرار الحالة في تجميع تناقض المشاعر من مستوى الكلمة إلى مستوى 
شبه الجملة أو الجملة. وقد لا يكون اتجاه المشاعر للوثيقة منطقيا للوثائق الكبيرة جدًا؛ ولذلك» 
فغالبًا ما يتم استخدامه على الوثائق الصغيرة إلى متوسطة الحجم المنشورة على الإنترنت. 


أسئلة مراجعة على القسم 5-0: 

-١‏ ما هو تحليل المشاعر؟ وكيف يرتبط بالتنقيب في النص؟ 

؟- ما هي مجالات التطبيق الأكثر انتشارًا لتحليل المشاعر؟ وماذا؟ 

-٠‏ ما هي الفوائد المتوقعة والمستفادة من تحليل المشاعر في السياسة؟ 
ع- ما هي الخطوات الرئيسة في تنفيذ مشاريع تحليل المشاعر؟ 

ه- ما هما الطريقتان الشائعتان لتحديد التناقض؟ اشرح. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري eva‏ 


الفصل الخامس 


۷-٥‏ نظرة عامة على التنقيب في الويب: 

لقد غيرت شبكة الإنترنت خطوات إجراءات الأعمال إلى الأبد. ونظرًا لكون العام الآن متصلا 
ببعضه البعض ومترابطًا بشكل كبير وأيضًَا لاتساع مجال ا منافسةء تواجه الشركات اليوم بشكل متزايد 
فرصا أكبر (وهي القدرة على الوصول إلى عملاء وأسواق لم يكن يُعتقد من قبل إمكانية الوصول 
إليها) وتحديات أكبر (أي السوق التنافسي المعوم والمتغير باستمرار). فالأفراد الذين يتمتعون برؤية 
وقدرات للتعامل مع مثل هذه البيئة ال متقلبة يستفيدون منها بشكل كبيرء في حين يواجه غيرهم 
ممن يكرهون التغيير صعوبة في البقاء في السوق. وم يعد الدخول على شبكة الإنترنت الآن خيارًا 
كماليّه فقد أصبح أحد متطلبات العمل الآن. فالعملاء ينتظرون استلام المنتجات / الخدمات من 
الشركات عبر الإنترنت. ولا يتوقف الأمر على الشراء فحسب. فهم أيضًا يشاركون مع أصدقائهم 
تجاربهم ومعاملاتهم التي تتم مع الشركات. 

ad)‏ أدى النمو المتسارع في الإنترنت وتقنياته التمكينية إلى تسهيل عمليات إنشاء وجمع 
البيانات وتبادل البيانات / المعلومات / الآراء. كما أن التأخيرات في الخدمة وعمليات التصنيع 
والشحن والتسليم واستعلامات العملاء لم تعد اليوم حوادث خاصة ويتم استقبالها والتعامل 
معها باعتبارها أمورًا ضرورية. فالشركات الناجحة هي التي تتبنّى تقنيات الإنترنت الحديثة فور 
ظهروها وتطوعها من أجل تحسين عملياتها التجارية بحيث يمكنها التواصل بشكل أفضل مع 
عملائها وفهم احتياجاتهم ورغباتهم وخدمتهم بشكل كامل وسريع. فلم يكن إطلاقًا التركيز على 
العملاء والحفاظ على مستوى رضاهم مفهومًا مهما للشركات كما هو في عصر الإنترنت ووسائل 
التواصل الاجتماعي التي نعيشها اليوم. 

تعتبر شبكة الإنترنت بمثابة مستودع ضخم للبيانات والمعلومات حول كل شيء يمكن أن يتصوره 
أي أحد. على سبيل اللثال لا الحصرء الأعمال التجارية» الأبحاث والنظريات العلمية, مقالات في شتى 
اللجالات» وبكميات وفيرة. وبذلك فربما تكون شبكة الويب هي أكبر مستودع للبيانات والنصوص 
في العام ويتزايد حجم اب معلومات على الويب بسرعةء مما هّن أي باحث من العثور على الكثير 
من المعلومات المثيرة لاهتمامه والوصول إلى صفحتها الرئيسية والصفحات الأخرى المرتبطة بهاء 
وكذلك إلى الأشخاص الذين لديهم روابط إلى تلك الصفحة. وبالإضافة إلى ذلكء يقوم كل زائر لأي 
موقع ويب وكل بحث على أي محرك بحث وكل نقرة على أي رابط وكل معاملة على أي موقع 
للتجارة الإلكترونية بإنشاء بيانات إضافية. وعلى الرغم من أن البيانات النصية غير المهيكلة في شكل 
صفحات الويب والمكتوبة بلغة .1112/1 أو .7311 هي المحتوى المهيمن على الويبء فإن البنية 
التحتية للويب تتضمن معلومات Colo (JI Jis) hyperlink information (s 25 JeU5)|‏ 


EN.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


ويب أخرى) ومعلومات الاستخدام (سجلات تفاعلات الزوار مع مواقع الويب)» وكلها توفر بيانات 

dus‏ لاكتشاف المعرفة. كما يمكن أن يساعدنا تحليل هذه المعلومات في تحسين استخدام مواقع 

الويب وكذلك مساعدتنا في تعزيز العلاقات والقيمة لزوار مواقعنا الخاصة. 

نخلص مما سبق إلى أن شبكة الإنترنت تتمتع بحجم هائل ومعقد. مما يجعل التنقيب في 

الويب ليس مهمةً سهلةً بأي وسيلة من الوسائل. كما تشكل الويب أيضًا تحديات كبيرة لاكتشاف 

:(Han & Kamber, 2006) 4à,s4JJ «cà$9 Jls 

- شبكة الويب كبيرة جدًا للتنقيب الفعّال عن البيانات: إن شبكة الإنترنت كبيرة جدًا ومتنامية بسرعة 
بحيث يصعب حتى قياس حجمها. ولذا؛ فليس من الممكن إنشاء مستودع بيانات لتكرار وتخزين 
ودمج جميع البيانات على الويب» مما يجعل جمع البيانات وتكاملها أمرًا غاية في الصعوبة. 

- الويب معقدٌّ للغاية: يعتبر تعقيد صفحة الويب أكبر بكثير منه لصفحة في مجموعة وثائق نصية 
تقليدية. وتفتقر صفحات الويب إلى بنية موحدة؛ فهي تحتوي على أنماط للتأليف ومحتوى 
أكبر بكثير من أي مجموعة من الكتب أو المقالات أو غيرها من الوثائق النصية التقليدية. 

- الويب حيوقٌ جدًا: يعتبر الويب مصدرًا للمعلومات مفعمًا بالحيوية لأبعد الحدود. ولا ينمو 
الويب بسرعةء بل يتم تحديث محتواه باستمرار؛ إذ يتم تحديث المدونات والقصص الإخبارية 
ونتائج أسواق الأسهم وتقارير الطقس والنتائج الرياضية والأسعار وإعلانات الشركات وأنواع 
أخرى من المعلومات بشكل منتظم على الويب. 

- شبكة الويب ليست خاصة بمجالٍ ia‏ تخدم الويب مجموعة كبيرة من المجتمعات كما تقوم 
بربط المليارات من محطات العمل. يتمتع مستخدمو الويب بخلفيات واهتمامات وأغراض 
استخدام مختلفة تمامًا. كما قد لا يكون لدى معظم المستخدمين معرفة جيدة بهيكل شبكة 
المعلومات أو قد لا يكونون على دراية بالتكلفة الباهظة لعملية بحث معينة يقومون بها. 

- الويب يحتوي على كل شيء: يعتبر جزء صغير فقط من ال معلومات الموجودة على الويب ذا صلة 
أو مفيد لشخص ما (أو لمهمة ما). يُقال إن 39“ من المعلومات على الويب لا فائدة منها ل 155 
من مستخدمي الإنترنت. وعلى الرغم من أن هذا قد لا يبدو واضحًاء إلا أن شخصًا ما قد يهتم 
بجزء صغير فقط من الويب» بينما تحتوي بقية الويب على معلومات يراها غير مهمة بالنسبة 
له وهي قد تؤدي إلى النتائج المرجوة؛ إذ يعتبر العثور على جزء من الويب ذي صلة حقيقية 
بشخص ما واللهمة التي يقوم بتنفيذها مسألة شائكة فيما يخص البحث المتعلق بالويب. 

دفعت كل هذه التحديات العديد من الجهود البحثية لتعزيز فعالية وكفاءة اكتشاف 
واستخدام أصول البيانات على شبكة الإنترنت» حيث يقوم عدد من محركات البحث على الويب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £M‏ 


الفصل الخامس 


القائمة على الفهرسة بالبحث باستمرار في الويب وتقوم بفهرسة صفحات الويب تحت كلمات 

رئيسية معينة. وباستخدام هذه المحركات قد يتمكن مستخدم متمرس من تحديد موقع الوثائق 

من خلال توفير مجموعة من الكلمات المفتاحية أو العبارات المقيدة بإحكام. ومع ذلكء فإن أي 

محرك بحث بسيط يعتمد فقط على الكلمات المفتاحية قد يواجه بعض المشكلاتء منها: 

-١‏ يمكن لأي موضوع معروض للبحث أن يحتوي بسهولة على مئات أو آلاف الوثائق. ويمكن 
أن يؤدي ذلك إلى عدد كبير من المدخلات ذات صلة هامشية بالموضوع والتي يتم إرجاعها 
بواسطة محرك البحث. 

-Y‏ قد لا تحتوي العديد من الوثائق ذات الصلة الكبيرة بالموضوع محل البحث على كلمات رئيسة 
دقيقة لتحددها. 
كما سنقوم بتغطية أكثر تفصيلًا لاحقًا في هذا الفصلء مقارنةً بالبحث على الويب القائم على 

الكلمات المفتاحية. يُعد التنقيب في الويب أحد الأساليب البارزة (والأكثر تحديًا) التي يمكن 

استخدامها لتعزيز قوة محركات البحث على الويب بشكل كبير؛ لأن التنقيب في الويب يمكنه 
تحديد صفحات الويب» وتصنيف وثائق الويب. وحل العديد من الغموض والخواطر التي يتم 

جمعها في محركات البحث القائمة على الكلمات المفتاحية. 
يعرف التنقيب في الويب (أو التنقيب في بيانات الويب) بأنه عملية اكتشاف العلاقات 

الجوهرية (أي المعلومات المثيرة للاهتمام والمفيدة) من بيانات الويبء والتي يتم التعبير عنها في 

شكل معلومات نصية أو ارتباطية أو معلومات الاستخدام. وقد تم استخدام مصطلح التنقيب 

في الويب 121138 11760 لأول مرة بواسطة (1996) 8]21001؛ وتركز اليوم العديد من LSU‏ 

والمجلات والكتب على التنقيب في بيانات الويب. إنه مجال متطور باستمرار من التقنية والممارسات 

التجارية. ويعتبر التنقيب على الويب في الأساس نفس عملية التنقيب في البيانات التي تستخدم 
البيانات التي يتم توليدها عبر الويب. ويكون الهدف من ذلك هو تحويل مستودعات واسعة من 
المعاملات التجارية وتفاعلات العملاء وبيانات استخدام موقع الويب إلى معلومات قابلة للتطبيق 
(أي المعرفة) وذلك لتشجيع اتخاذ قرارات أفضل في جميع أنحاء المؤسسة. وبسبب زيادة انتشار 
مصطلح التحليلات: شرع الكثيرون في الوقت الحاضر في الرجوع إلى التنقيب على شبكة الإنترنت 
وتحليلات الويب. ومع ذلكء لا يعتبر هذان المصطلحان شيئًا واحدًا. وفي حين تعد تحليلات الويب 
في المقام الأول هي بيانات استخدام موقع الويب» فإن التنقيب على الويب يشمل جميع البيانات 
التي يتم توليدها عبر الإنترنت بما في ذلك بيانات المعاملات الاجتماعية وبيانات الاستخدام. وحيث 


£AY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


تستهدف تحليلات الويب وصف ما حدث على موقع الويب (باستخدام منهجية تحليلية وصفية 
مبنية على مقاييس ومحددة مسبقًا). يهدف التنقيب في الويب إلى اكتشاف أنماط وعلاقات غير 
معروفة من قبل (باستخدام منهجية تحليلية جديدة للتنبؤ أو منهجية توجيهية). ومن منظور 
أكثر اتساعًاء يمكن اعتبار تحليلات الويب جزءًا من التنقيب في الويب. ويعرض الشكل )١١-0(‏ 
تصنيقًا بسيطً للتتنقيب على الويب» حيث يتم تقسيمه إلى ثلاثة مجالات رئيسة هي: التنقيب 
في محتوى الويب والتنقيب في بنية الويب والتنقيب باستخدام الويب. وفي هذا الشكل أيضّاء 
يتم تحديد مصادر البيانات المستخدمة في هذه المناطق الرئيسة الثلاثة. وعلى الرغم من أن هذه 
المجالات الثلاثة تظهر بشكل منفصلء كما سترى في القسم التالي من هذا الفصلء إلا أنها غالبًا ما 
تُستخدم بشكل جماعي وتكاملي لمعالجة مشكلات وفرص الأنشطة التجارية. 


(eMule Ded] 
التنقيب فى الويب‎ 
التنقيب فى استخدام الويب التنقيب فى هيكل الويب التنقيب فى محتوى الويب‎ 
Source. unstructured Source: the unified Source the detailed 
content of the resource locator (URLI description of a Web 
+ Webpages (usualyin —-— links in —. se's visis (sequence --—-— | 
HTML format) Web pages 


i 

i 
)  ثحبلا محركات‎ Ii تحليل المشاعر‎ Jm T تحليلات الويب‎ i 
T تحليلات اجتماعية || تنقبى ثرسم يني |[ استرجاع المعلومات || رتبة الصفحة‎ || — manes | 
تحليل مرونة الويب ]أ[ تحليلات وساتل التواصل الإجتماعي تحليل الشبكة الإجتماعية |[ تحسين محرك البحث‎ I 
360 رأى العميل‎ J صوت العميل‎ J : 





| | التنقيب فى إا التنقيب | 
| 
| 


i l إسناد التسويق‎ JL تحليلات العملاء‎ | 
i 


شكل :1١-0‏ تصنيف مبسط للتنقيب في الويب 
وكما يوضح الشكل »)١١-0(‏ يعتمد التنقيب على الويب بشكل كبير على التنقيب في البيانات 
واستخراج النصوص وأدواتها وتقنياتها التمكينية, والتي قمنا بتغطيتها بالتفصيل في وقت مبكر من 
هذا الفصل وفي الفصل السابق (الفصل 6). ويشير هذا الشكل أيضًا إلى أن هذه المناطق العامة 
الثلاثة تمتد إلى العديد من مناطق التطبيق المعروفة جيدًا. وقد تم شرح بعض هذه المجالات في 
الفصول السابقة» وسيتم تغطية يعض الجوانب الأخرى بالتفصيل في هذا الفصل. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري EA‏ 























الفصل الخامس 


التنقيب في محتوى الويب وهيكل الويب: 

يشير مصطلح التنقيب في محتوى الويب إلى استخراج ا لمعلومات المفيدة من صفحات الويب؛ 
حيث يتم استخراج الوثائق بتنسيق يمكن قراءته آليّا حتى تتمكن التقنيات الآلية من استخلاص 
بعض ال معلومات من صفحات الويب هذه. كما يتم استخدام برامج زواحف الويب 115تهته «اء187 
(ويُطلق عليها أيضًا العناكب (Spiders‏ لقراءة محتوى موقع الويب تلقائيًا. وقد تتضمن المعلومات 
التي تم تجميعها خصائص وثائقية مشابهة لما يتم استخدامه في التنقيب في النصء ولكنها قد 
تتضمن أيضًا مفاهيم إضافية. مثل التسلسل الهرمي للوثائق. ويمكن استخدام عملية الجمع الآلي 
(أو شبه الآلي) لمحتوى الويب والتنقيب فيه للحصول على معلومات ذكاءية تنافسية (بما يعني 
جمع المعلومات المتعلقة با منافسين ومنتجاتهم وخدماتهم التي يقدمونها وعملائهم). كما يمكن 
استخدامه أيضًَا لجمع المعلومات / الأخبار / الآراء وتلخيصها وتحليل المشاعر والجمع التلقائي 
للبيانات وتنظيمها من أجل النمذجة التنبؤية. وكمثال توضيحي لاستخدام التنقيب في محتوى 
الويب كأداة لجمع البيانات بطريقة آليةء دعنا نأخذ في الاعتبار ما يلي: منذ أكثر من ٠١‏ سنوات» 
قام كل من دكتور 50308 1261629 بتطوير نماذج للتنبؤ بالنجاح المالي لأفلام هوليوود قبل إصدارها 
المسرحي؛ حيث تأتي البيانات التي يستخدمونها لتدريب النماذج من عدة مواقع على الويب» لكل 
منها بنية صفحة هرمية مختلفة. والجدير بالذكر أن عملية جمع مجموعة كبيرة من المتغيرات على 
آلاف الأفلام (من عدة سنوات سابقة) من مواقع الويب عملية تتطلب الكثير من الوقت وكذلك 
عرضة للخطأ. ولذلك؛ فهي تستخدم التنقيب في محتوى الويب والعناكب 5010655 باعتبارها تقنية 
تمكينية لجمع واختبار صحة وصلاحية وتخزين هذه القيم في قاعدة بيانات علائقية. (وفيما يخص 
اختبار الصحة والصلاحيةء فإذا كان عنصر البيانات المحدد متاحًا على أكثر من موقع ويب واحد 
عندئذ يتم التحقق من صحة القيم ضد بعضها البعض ويتم التقاط وتسجيل الانحرافات)؛ وبذلك 
فهي تضمن جودة البيانات مع توفير وقت العملية الثمين (أيام أو أسابيع). 

وبالإضافة إلى احتوائها على النصوص. تحتوي صفحات الويب أيضًا على روابط تشعبية 
تشير صفحة واحدة إلى أخرى 5118215م7(؛ إذ تحتوي الروابط التشعبية على قدر كبير من 
التعليقات التوضيحية البشرية المخفاة التي يمكن أن تساعد في الاستنتاج التلقائي لمفهوم المركزية 
أو السلطة. وعندما تشتمل صفحة ويب على رابط يشير إلى صفحة ويب أخرىء فيمكن اعتبار 
ذلك بمثابة موافقة المطوّر على الصفحة الأخرى. وقد يشير التأييد الجماعي لصفحة معينة 
على الويب من قبل مطوّرين مختلفين إلى أهمية تلك الصفحة: وقد يؤدي ذلك بشكل طبيعي 
إلى اكتشاف عدة صفحات ويب موثوقة (2005 8111165). لذلك؛ فإن وجود كمية هائلة 


ENE‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


من المعلومات المترابطة عبر الإنترنت يوفر مجموعة غنية من المعلومات حول مدى ملاءمة 

محتويات الويب وجودتها وهيكلهاء وتعتبر بالتالي مصدرًا غنيًًا للتنقيب في الويب. 
كما يمكن استخدام التنقيب في محتوى الويب لتعزيز النتائج التي تنتجها محركات البحث. 

وفي الواقعء قد يكون البحث هو التطبيق الأكثر انتشارًا للتنقيب في محتوى الويب وتعديل بنية 

الويب. وعادةً ما يقودنا البحث على الويب الذي يتم بغرض الحصول على معلومات حول 
موضوع معين (والذي يتم تقديمه كجملة أو مجموعة كلمات مفتاحية) إلى بضع صفحات ويب 
ذات صلة بالموضوع محل البحثء وتكون ذات جودة عالية وأيضًا إلى عدد أكبر من صفحات 
الويب غير القابلة للاستخدام. ويؤدي استخدام الفهرس المتعلق با لموضوع محل البحث استنادًا 
إلى الكلمات المفتاحية والصفحات الرسمية (أو بعض مقاييسها) إلى تحسين نتائج البحث وترتيب 
الصفحات ذات الصلة. وتنبع فكرة المسؤولية الفكرية (أو الصفحات الموثوقة) من استرجاع 
المعلومات سابقة النشر باستخدام اقتباسات من مقالات المجلات لتقييم تأثير الأوراق البحثية 
(21116:2005). وبالرغم من أن هذا هو أصل الفكرة. إلا أن هناك اختلافات معنوية بين 

الاقتباسات في المقالات البحثية والروابط التشعبية 6.1515 م:زط على صفحات الويب وهي: 

-١‏ لا يمثل كل رابط تشعبي مصادقة أو موافقة (فبعض هذه الروابط يتم إنشاؤه لأغراض التصفح 
وبعضها للإعلانات المدفوعة). وعلى الرغم من أن هذا صحيح. إذا كانت غالبية الارتباطات 
التشعبية من نوع المصادقة: فسيظل الرأي الجماعي سائدًا. 

"- بالنسبة للحالات التجارية والتنافسية» نادرًا ما ستشير إحدى الإدارات على صفحتها على الإنترنت 
إلى الصفحات المنافسة لها في نفس المجال. فعلى سبيل المثال. قد لا تفضل Microsoft‏ 
تضمين روابط على صفحات الويب الخاصة بها تشير إلى المواقع الخاصة بشركة ءاممله؛ لأن 
هذا قد يعتبر بمثابة تصديق على سلطة منافسها. 

Yahoo قد لا تحتوي صفحة‎ Ñas ما تكون الصفحات الموثوقة وصفية بشكل خاص.‎ əb -Y 
الرئيسية على وصف ذاتي صريح بأنه في الواقع محرك بحث.‎ 
وقد أفرز هيكل الروابط التشعبية على الويب تصنيقًا آخر مهما لصفحات الويب يسمى‎ 

cub jl‏ 525 واحد أو أكثر من صفحات الويب التي توفر مجموعة من الروابط المشيرة إلى 

صفحات موثوقة أخرى. وقد لا تكون المحاور بارزة» وأيضًا قد يشار إليها بروابط قليلة Jis‏ 

ومع ذلك فإنها توفر روابط تشير إلى مجموعة من المواقع البارزة حول الموضوع محل الاهتمام 

أو الدراسة. وقد يكون المحور عبارة عن قائمة بالروابط الموصى بها على الصفحات الشخصية: أو 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £0 


الفصل الخامس 


قائمة بلمواقع المرجعية المقترحة على صفحة الويب الخاصة بدورة تدريبية ماء أو قائمة موارد تم 
تجميعها بشكل احترافي حول موضوع محدد. كما تلعب المحاور دورًا ضمنيًا في الحد من اتساع 
نطاق السلطات. وجوهربًاء توجد علاقة تكافلية وثيقة بين المحاور الجيدة والصفحات ال موثوقة؛ 
فام محاور الجيدة تكون جيدة لأنها تشير إلى العديد من السلطات الجيدة والسلطة الجيدة تكون 
جيدة بسبب الإشارة إليها من قبل العديد من الحاور الجيدة. وهذه العلاقات بين المحاور 
والسلطات تجعل من الممكن تلقائيًا تلفي محتوى le‏ الجودة من الويب. 

إن أكثر الخوارزميات المعروفة والمشار إليها بشكل عام والمستخدمة في حساب المحاور 
والسلطات هي البحث عن الموضوع الذي يُحدثه الارتباط التشعبي (11115) والذي تم تطويره 
ف الأصل من قبل (1999 ,عإ٠ط«1ه1).‏ ومنذ ذلك الحين تم تحسينه أكثر من مرة بواسطة 
العديد من الباحثين. إن 11115 عبارة عن خوارزمية تحليل رابط تقوم بتصنيف صفحات الويب 
باستخدام معلومات الرابط التشعبي الموجودة بداخلها. وفي سياق بحث الويب» تقوم خوارزمية 
5 بجمع مجموعة وثائق أساسية لاستعلام محدد مسبقًا ثم تقوم بشكل متكرر بحساب 
كل من المحور والسلطة لكل وثيقة. ولتجميع مجموعة الوثائق الأساسيةء يتم استدعاء مجموعة 
الجذر التي تطابق الاستعلام من محرك بحث. ولكل وثيقة تم استرجاعهاء تتم إضافة مجموعة 
من الوثائق التي تشير إلى الوثيقة الأصلية ومجموعة أخرى من الوثائق التي يشار اليها بواسطة 
الوثيقة الأصلية إلى المجموعة على أنها منطقة الوثيقة الأصلية. وهكذا تستمر عملية متكررة 
لتحديد هوية الوثيقة وتحليل الرابط حتى تتقارب قيم كل من ال محور والسلطةء ثم يتم استخدام 
هذه القيم لفهرسة مجموعة الوثائق التي تم إنشاؤها لاستعلام محدد وترتيبها حسب الأولوية. 

يعتبر التنقيب في هيكل الويب عملية استخراج معلومات مفيدة من الروابط المضمّنة في 
وثائق الويبء ويتم استخدامه لتحديد الصفحات الموثوقة وا لمحاورء والتي تعتبر حجر الزاوية 
في الخوارزميات المعاصرة للصفحات الأساسية: والقي تعتبر محوزية لمحركات البحث الشهيرة 
مثل عاع600 وه0وطهلآ. ومثلما تشير الروابط الموضوعة لصفحة ويب إلى شعبية الموقع (أو 
موثوقيته). قد تشير الروابط الموجودة في صفحة الويب (أو موقع الويب الكامل) إلى عمق 
التغطية لموضوع محدد. يعتبر تحليل الروابط مهما للغاية في فهم العلاقات المتبادلة بين أعداد 
كبيرة من صفحات الويبء مما يؤدي إلى فهم أفضل بلجتمع ويب معين. 
أسئلة للمراجعة على قسم 0-لا: 
1- ما هي بعض التحديات الرئيسة التي يفرضها الويب على اكتشاف المعرفة؟ 
۷ ما هو التنقيب في الويب؟ وكيف يختلف عن التنقيب المنتظم في البيانات أو التنقيب في النصوص؟ 


£M‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


۸- ما هي ال مجالات الرئيسة الثلاثة للتنقيب في شبكة الإنترنت؟ 
9- ما هو التنقيب في محتوى الويب؟ وكيف هكن استخدامه طيزة تنافسية؟ 
-٠١‏ ما هو التنقيب في هيكل (بنية) الويب؟ وكيف يختلف عن التنقيب في محتوى الويب؟ 


A-O‏ محركات البحث: 

في الوقت الحالي» لا يستطيع أحد إنكار أهمية محركات البحث على الإنترنت. وتجدر الإشارة 
إلى أنه كلما زاد حجم وتعقيد شبكة الويب العالمية» أصبح العثور على ما تريد عملية معقدة 
وشاقة. ومن المعلوم أن محركات البحث تُستخدم لأسباب متنوعة. فيمكن استخدامها للتعرّف 
على منتج أو خدمة ما قبل اتخاذ القرار بالشراء (بما في ذلك اختيار البائع أو مقدم الخدمة 
والأسعار على المواقع / الباعة المتنوعة» والقضايا الشائعة التي يناقشها الناس حول هذا المنتج» 
ومدى رضا المشترين السابقينء وما هي المنتجات أو الخدمات الأخرى التي قد تكون أفضلء؛ وما 
إلى ذلك)» وللبحث عن الأماكن التي يجب زيارتهاء والأشخاص الواجب الالتقاء بهم» والأشياء 
الواجب القيام بها. معنى آخرء أصبحت محركات البحث محور معظم المعاملات المستندة إلى 
الإنترنت وغيرها من الأنشطة. ويستند هذا الادعاء إلى النجاح المذهل والشعبية الجارفة لشركة 
Google‏ وهي الشركة الأكثر انتشارًا في مجال محركات البحث. وما هو غامض إلى حد ما بالنسبة 
للكثيرين هو كيف يقوم محرك البحث بتنفيذ ما يقصده المستخدم. بعبارة أبسطء يعتبر محرك 
البحث برنامجًا يقوم بالبحث عن الوثائق (مواقع الإنترنت أو الملفات)» استنادًا على الكلمات 
المفتاحية التي يقدمها المستخدمونء والتي تتعلق بموضوع بحثهم (سواء كانت كلمات فردية 
أو مصطلحات متعددة الكلمات أو جملة كاملة). إن محركات البحث اليوم هي منبر الإنترنت» 
وبإمكانها الاستجابة لملايين من الاستفسارات بمئات اللغات المختلفة كل يوم. 

من الناحية التقنية» فإن ”محرك البحث“ هو المصطلح الشائع لأنظمة استرداد المعلومات. 
وعلى الرغم من أن محركات البحث على الويب هي الأكثر شيوعًَاء فغالبًا ما تُستخدم في سياقات 
أخرى غير الويب» مثل محركات بحث سطح المكتب ومحركات بحث الوثائق. وكما سترى في هذا 
القسم. فإن العديد من المفاهيم والتقنيات التي قمنا بتغطيتها في تحليلات النصوص والتنقيب 
في النص في وقت مبكر من هذا الفصل تنطبق هنا أيضًا. ويعتبر الهدف العام لمحرك البحث 
هو إرجاع وثيقة / صفحة واحدة أو أكثر والتي تتطابق بشكل أفضل مع طلب بحث المستخدم: 
وفي حالة وجود أكثر من وثيقة / صفحة واحدة, Ulli‏ ما يتم عرضهم في قائمة مُرتّبة وفقًا لمعيار 
محدد. وغالبًا ما يتم استخدام مقياسين لتقييم محركات البحث» وهما: 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £V‏ 


الفصل الخامس 


-١‏ الفعالية (أو الجودة): وتعني العثور على الوثائق / الصفحات الصحيحة. 
؟- الكفاءة (أو السرعة): وتعني إعادة الاستجابة بسرعة. 

ويعمل هذان المقياسان في اتجاهين متعاكسينء بمعنى أن تحسين أحدههما يأ على حساب 
الآخرء ويكون ذلك بالطبع És‏ لتوقعات المستخدم. وأفضل محركات البحث هي تلك التي تتفوق 
في كل من المقياسين في نفس الوقت. ونظرًا لأن محركات البحث لا تبحث فقطء بل هي في الواقع 
تجد الوثائق / الصفحات وتعرضهاء فربما كان هناك اسم أكثر ملاءمة لها وهو محركات الإيجاد. 


تشريح محرك بحث: 

الآن دعونا نحلل محرك بحث وننظر في داخله. على أعلى مستوىء يتألف نظام محرك البحث 
من دورتين رئيستين: دورة تطوير ودورة استجابة (ويعرض الشكل (0-؟17١)‏ هيكل محرك بحث 
نموذجي على الإنترنت). ويمكننا تشبيه دورة التطوير بعملية الإنتاج (تصنيع وتخزين الوثائق / 
الصفحات) ودورة الاستجابة بعملية البيع بالتجزئة (تزويد العملاء / المستخدمين بما يريدون). 
وسيتم شرح هاتين الدورتين بمزيد من التفصيل في القسم التالي من هذا الفصل. 


Q 9 8 


الإنترنت 





شكل :١7-0‏ هيكل نموذجي محرك بحث الإنترنت 


-١‏ دورة التطوير: 

يعتبر المكونان الرئيسان لدورة التطوير هما زاحف الويب 1216161 1176 ومفهرس الوثيقة 
1120661 10611116114. ويعد الغرض من هذه الدورة هو إنشاء قاعدة بيانات ضخمة من الوثائق 
/ الصفحات منظمة ومفهرسة بناءً على قيمة محتواها ومعلوماتها. ومما يظهر بوضوح شديد أن 
السبب في تطوير مثل هذا المستودع من الوثائق / الصفحات هو حجمه الكبير وتعقيده فالبحث 


EM‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


في الويب للعثور على صفحات استجابة لتلبية احتياجات المستخدمين ليس عمليًا (أو ممكنًا في إطار 
زمني معقول) ولذلك تقوم محركات البحث ”بتخزين الويب“ في قاعدة البيانات الخاصة بهاء ومن 
ثم تستخدم النسخة المخبأة للويب للبحث عن وإيجاد كل ما يطلبه المستخدم. وبمجرد إنشائهاء 
تسمح قاعدة البيانات هذه لمحركات البحث بالرد بسرعة وبدقة على استعلامات ال مستخدمين. 


- زاحف الويب 319165 11/65: (ويسمى أيضًا العنكبوت أو عنكبوت الويب) وهو جزء من برنامج 
يقوم بالتصفح بشكل منهجي (أي يزحف عبر الإنترنت) بغرض العثور على صفحات الويب وجلبها. 
وفي كثير من الأحيان تقوم برامج زحف الويب بنسخ كل الصفحات التي تتم زيارتها وذلك لمعالجتها 
لاحقًا بواسطة وظائف أخرى لمحرك البحث. يبدأ زاحف الويب بإعداد قائمة من عناوين URL‏ 
المراد زيارتهاء ويتم سردها في جدولء وغالبًا ما يطلق عليها البذور. وقد تأتي عناوين .1711 هذه 
من تقدهات مشرف ال مواقع أو - في أغلب الأحيان - تأتي من الروابط التشعبية الداخلية للوثائق / 
للصفحات التي تم الزحف إليها سابقًا. وبمجرد أن يزور الزاحف عناوين 0۸1 هذه فإنه يحدد 
جميع الروابط التشعبية الموجودة في الصفحة ويضيفها إلى قائمة عناوين .17181 المراد زيارتها. وتتم 
زيارة عناوين :1781 المجدولة بشكل متكرر وفقًا لمجموعة من السياسات التي يحدذها محرك 
البحث المحدد. ونظرًا لوجود عدد كبير جدًا من صفحات الويب» فيمكن للزاحف تنزيل عدد 
محدود فقط منها في وقت معين فقط؛ ولذلك فهي تحتاج إلى تحديد أولويات التنزيلات الخاصة بها. 
- مفهرس الوثيقة 12061 006111716116: عندما يتم العثور على الوثائق وجلبها من خلال 
doly‏ يتم تخزينها في منطقة مؤقتة لمفهرس الوثيقة وذلك لاستخراجها ومعالجتها. ويكون 
مفهرس الوثيقة مسؤولًا عن معالجة الوثائق (صفحات الويب أو ملفات الوثائق) ووضعها 
في قاعدة بيانات خاصة بها. ولتحويل الوثائق / الصفحات إلى التنسيق ال مرغوب فيه والقابل 
للبحث عنه بسهولة» يقوم مفهرس الوثائق بتنفيذ المهام التالية: 
- الخطوة -١‏ المعالجة ا مسبقة للوثائق: نظرًا لاحتمالية ظهور الوثائق المتحصل عليها عن طريق 
الزاحف في تنسيقات مختلفة» ولسهولة معالجتها أكث. فسيتم في هذه الخطوة تحويلها كلها 
إلى أحد أنواع التمثيل القياسي. فمثلًا يتم فصل المحتويات المختلفة عن بعضها البعض 
ومن ثم تنسيقها (إذا لزم الأمر) وتخزينها في مكان ما لزيد من المعالجة. وتتضمن هذه 
المحتويات مثلًا (النصوصء الروابط التشعبية الصورء إلخ). 
- الخطوة ۲- تحليل الوثائق: وهذه الخطوة هي ساسا تطبيق أدوات وتقنيات التنقيب في 
النص (آي اللغويات الحاسوبيةء ومعالجة اللغة الطبيعية )١N1۲‏ إلى مجموعة من الوثائق 
/ الصطفحات. وفي هذه الخطوة: يتم أولًا تحليل الوثائق القياسية إلى مكونات لتحديد 
ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري E‏ 





الفصل الخامس 


الكلمات / المصطلحات الجديرة بالفهرسة. ثم بعد ذلك - وباستخدام مجموعة من القوانين 
- تتم فهرسة الكلمات / المصطلحات. وبشكل أكثر تحديدًا - وباستخدام قواعد التحويل - 
يتم استخراج الكلمات / المصطلحات / الكيانات من الجمل الموجودة في هذه الوثائق» ثم 
باستخدام معاجم خاصة» يتم تصحيح الأخطاء الإملائية والأخطاء الأخرى في هذه الكلمات 
/ ا مصطلحات» مع ملاحظة عدم كون كل المصطلحات من أدوات التمييز. كما يتم استبعاد 
الكلمات / المصطلحات غير التمييزية (والمعروفة أيضًا باسم كلمات التوقف) من القائمة 
الجديرة بالفهرسة. ونظرًا لاحتمال ظهور نفس الكلمة / المصطلح بصيغ متعددة ومختلفة. 
فيتم اتخاذ بعض الإجراءات التي تعمل على تقليل عدد الكلمات / المصطلحات ووضعها في 
صورها الأصلية. ومرةً أخرىء يتم استخدام المعاجم وموارد أخرى خاصة بلغة معينة (مثل 
+10071)). كما يتم تحديد المرادفات والمجانسات اللفظية: لمعالجة مجموعة الكلمات / 
المصطلحات قبل الانتقال إلى مرحلة الفهرسة. 

- الخظوة "- إنشاء مصفوفة ”المصطلح بحسب الوثيقة" :Term-by-document‏ 

في هذه الخطوة: يتم تحديد العلاقات بين الكلمات / المصطلحات والوثائق / الصفحات. 
ويمكن أن يكون الوزن بسيطًا كتخصيص )١(‏ للحضور أو (0) للغياب في الوثيقة / الصفحة. 
وعادةً ما يتم استخدام مخططات الوزن الأكثر تطورًا. وعلى سبيل «JEU‏ في تعارض ثنائيء قد 
يتم تخصيص التكرار كوزن (أي عدد مرات وجود نفس الكلمة / المصطلح في الوثيقة). وكما 
رأينا سابقًا في هذا الفصلء فقد أشارت الأبحاث والممارسات المتعلقة بالتنقيب عن النصوص 
بوضوح أن أفضل ترجيح قد يأتي من استخدام مصطلح التكرار مقسومًا على تكرار العكسي 
الوثيقة (121 / 158). تقيس هذه الخوارزمية تكرار حدوث كل كلمة / مصطلح في وثيقة ما 
ثم تقارن ذلك التكرار في مقابل تكرار حدوثه في مجموعة الوثائق. وكما نعلم جميعًاء لا تعتبر 
كل الكلمات / المصطلحات ذات التكرار العالي عوامل تمييز جيدة للوثيقة» وأيضًا فإن أحد 
العناصر الجيدة لتمييز الوثيقة في مجال ما قد لا يكون جيدًا في مجال آخر. وبمجرد تحديد 
مخطط الوزن يتم حساب الأوزان ويتم إنشاء ملف فهرس «المصطلح بحسب الوثيقة». 

'ا- دورة الاستجابة: 
يعتبر المكونان الرئيسان لدورة الإستجابة هما محلل الاستعلام 30217261 7م01 ومُطابق / 

-document matcher/ranker 4à55Jl مصنف‎ 

- محلل الاستعلام 3021(7265 :01161: يكون محلل الاستعلام sS us‏ عن تلقي طلب البحث 

من المستخدم (عبر واجهة خادم الويب لمحرك البحث) وتحويله إلى هيكل بيانات قياسي» 


.6 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


بحيث يمكن استجوابه / مطابقته بسهولة في مقابل الإدخالات في قاعدة بيانات الوثيقة. إن 
كيفية قيام محلل الاستعلام بما يفترض عمله تشابه تمامًا ما يقوم به مفهرس الوثيقة (كما تم 
توضيحه منذ قليل)؛ حيث يقوم محلل الاستعلام بتوزيع جملة البحث إلى كلمات / مصطلحات 
فردية باستخدام سلسلة من المهام التي تشمل التحويلء وإزالة كلمات التوقف. وتطبيق بعض 
الإجراءات» وتوضيح الكلمة / المصطلح (أي تحديد الأخطاء الإملائيةء واممترادفات وا مجانسات 
اللفظية). إن التشابه الوثيق بين محلل الاستعلام ومفهرس الوثيقة ليس من قبيل الصدفة. في 
الواقع» إن هذا التشابه ON Ds SLE (Raza‏ كليهما يعمل خارج قاعدة بيانات الوثائق؛ فأحدها 
يضع الوثائق / الصفحات باستخدام هيكل فهرس محدد» والآخر يقوم بتحويل سلسلة استعلام 
إلى نفس الهيكل بحيث هكن استخدامها لتحديد موقع الوثائق / الصفحات ذات الصلة بسرعة. 
- مُطابق / مصنف الوثيقة :cument matc1eإ/ra k۴۲‏ وهنا تتم مطابقة بيانات الاستعلام 
المهيكلة مع قاعدة بيانات الوثيقة للعثور على الوثائق / الصفحات الأكثر ملاءمة وترتيبها أيضًا 
حسب ترتيب وثاقة الصلة بالموضوع / الأهمية. وربما يكون إتقان هذه الخطوة هو المكون 
الأكثر أهمية عند مقارنة محركات البحث المختلفة مع بعضها البعض. ويمتلك كل محرك بحث 
خوارزمية خاصة به (وغالبًا تكون ملكية مرخصة) يستخدمها لتنفيذ هذه الخطوة المهمة. 
استخدمت محركات البحث في بداية ظهورها تطابقًا بسيطًا للكلمة المفتاحية مع قاعدة 
بيانات الوثائق وأعادت قائمة الوثائق / الصفحات المرتبة حيث كان يعتبر تحديد الطلب هو 
إحدى الوظائف التي استخدمت عدد الكلمات / المصطلحات المتطابقة بين الاستعلام والوثيقة إلى 
جانب أوزان تلك الكلمات / المصطلحات. لم تكن جودة وفائدة نتائج البحث كلها جيدة. بعد 
ذلك وتحديدًا في عام /1991ء توصل منشئو 60081 إلى خوارزمية جديدة 2243( Page Rank‏ 
وكما يشير الاسمء يعتبر 143516 2386 طريقة حسابية لترتيب الوثائق / الصفحات بناءً على مدى 
ملاءمتها وقيمتها / أهميتها. وعلى الرغم من كون 1321 2886 طريقة مبتكرة لتصنيف الوثائق 
/ الصفحات. إلا أنه يعد زيادةً في عملية استرجاع الوثائق ذات الصلة من قاعدة البيانات وترتيبها 
بناءً على أوزان الكلمات / المصطلحات. تقوم 60081 بكل ذلك بشكل جماعي بغرض إعداد 
أفضل قائمة وثائق / صفحات من حيث الصلة يطلب البحث المعطّى. وبمجرد إنشاء قائمة مرتبة 
من الوثائق / الصفحات» يتم إعادتها مردً أخرى إلى المستخدم بتنسيق سهل الاستيعاب. في هذه 
ا cio‏ قد يختار المستخدم أي وثيقة من الوثائق الموجودة في القائمة والنقر عليهاء وقد لا تكون 
هذه الوثيقة هي الأولى في أعلى القائمة. وإذا حدث هذا وتم اختيار وثيقة / صفحة غير الموجود 
في أعلى القائمة» فهل يمكننا أن نفترض أن محرك البحث لم يقم بترتيبهم ترتيبًا جيدًا؟ قد تكون 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1 


الفصل الخامس 


الإجابة نعم حيث تقوم محركات البحث الرائدة مثل 16ع600 مراقبة أداء نتائج البحث الخاصة 
بها من خلال التقاط وتسجيل وتحليل إجراءات وتجارب ما بعد تسليم المستخدمين. وغالبًا 
ما تؤدي هذه التحليلات إلى المزيد والمزيد من القواعد بهدف زيادة تحسين ترتيب الوثائق / 
الصفحات بحيث تكون الروابط في الأعلى هي الأكثر تفضيلًا للمستخدمين النهائيين. 
تحسين محرك البحث: 

إن تحسين محرك البحث (580) هي ممارسة يقصد منها التأثير على رؤية موقع التجارة 
الإلكترونية أو موقع الويب في نتائج البحث الطبيعية (غير المدفوعة أو الأساسية) بمحرك البحث. 
وبشكل عامء كلما ارتفعت الرتبة في صفحة نتائج البحثء وكلما تكرر ظهور الموقع في قانئمة 
نتائج البحثء ازداد عدد الزوار الذين سيحصلون عليه من مستخدمي محرك البحث. وكإحدى 
إستراتيجيات التسويق عبر الإنترنت» تضع 5880 في اعتبارها كيفية عمل محركات البحث» وما 
يبحث عنه الأشخاص: والمصطلحات الحقيقية للبحث أو الكلمات المفتاحية التي تتم كتابتها في 
محركات البحث» ومحركات البحث التي يفضلها الجمهور المستهدف. وقد ينطوي تحسين موقع 
الويب على تعديل محتواه و1١11‏ والتشفر المرتبط به لزيادة مدى ملاءمته لكلمات رئيسة 
محددة ولإزالة الحواجز أمام أنشطة الفهرسة لمحركات البحث. كما يعد الترويج مموقع ما بغرض 
زيادة عدد الروابط الخلفية أو الداخلية: أحد الأساليب الأخرى لتحسين محركات البحث. 

في السابق» ولي تتم الفهرسة: كان على كل مشرفي المواقع إرسال عنوان صفحة: أو عنوان 
URL‏ إلى مختلف المحركات» والتي ستقوم بعد ذلك بإرسال ”عنكبوت“ لكي يقوم ب ”الزحف“ 
تجاه تلك الصفحةء ومن ثم يستخرج منها الروابط إلى صفحات» ثم يقوم بإرجاع ال معلومات التي 
تم العثور عليها على الصفحة إلى الخادم لتتم الفهرسة. وكما تم التوضيح من قبلء تتضمن هذه 
العملية قيام عنكبوت محرك بحث بتنزيل صفحة وتخزينها على الخادم الخاص بمحرك البحث» 
حيث يقوم برنامج آخر - يعرف باسم المفهرس - باستخلاص معلومات متنوعة عن تلك الصفحة» 
مثل الكلمات التي تحتويها ومواقع تلك الكلمات بالتحديد, بالإضافة إلى أي وزن لكلمات محددة, 
وكل الروابط التي تحتوي عليها الصفحة» والتي تتم جدولتها بعد ذلك بغرض القيام بالزحف في 
وقت لاحق. أما الآن» فلم تعد محركات البحث تعتمد على تقديم مشرفي المواقع عناوين URL‏ 
(على الرغم من قدرتهم على فعل ذلك حتى الآن)؛ ولكنهم يمارسون الزحف الحثيث والمستمر 
على الويب لإيجاد وجلب وفهرسة كل شيء يتعلق بالبحث. 

إن إجراء الفهرسة بواسطة محركات بحث Le lao gu Yahoos Bings Google |J is‏ 
فيه الكفاية للأنشطة التجارية» حيث إن اكتتساب ترتيب على محركات البحث الأكثر استخدامًا 


tay‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


والحصول على مرتبة أعلى من منافسيك هو ما يصنع الفرق (انظر الفكرة التطبيقية (5-0) 
للحصول على قائمة محركات البحث الأكثر استخدامًا). ويمكن رفع ترتيب صفحة ويب داخل 
نتائج البحث باستخدام مجموعة متنوعة من الأساليب. كما أن الارتباط المتبادل بين صفحات 
نفس موقع الويب يوفر مزيدًا من الروابط إلى الصفحات الأكثر أهمية مما يزيد من فرص رؤيتها 
ضمن نتائج البحث. وستؤدي كتابة المحتوى الذي يتضمن عبارات الكلمات المفتاحية التي يتم 
البحث عنها بشكل متكرر - بحيث تكون ذات صلة بمجموعة كبيرة من استعلامات البحث - إلى 
زيادة عدد الزيارات. كما أن تحديث المحتوى بغرض الحفاظ على الزحف إلى محركات البحث 
بشكل متكرر يضفي على الموقع زيادة في الوزن. وكذلك تؤدي إضافة كلمات رئيسة ذات صلة إلى 
البيانات الوصفية لصفحة الويب - بما في ذلك علامة العنوان والوصف الدقيق - إلى تحسين مدى 
ملاءمة قوائم البحث الخاصة بامموقع» وبالتالي زيادة عدد الزيارات. ويمكن أن تساعد تسوية 
عناوين .10181 لصفحات الويب - بحيث يمكن الوصول إليها عبر عناوين ,1011 متعددة واستخدام 
عناصر ربط العناوين الأساسية والاتجاهات - في التأكد من أن جميع الروابط المؤدية إلى إصدارات 
مختلفة من عنوان 0۸1 يتم احتسابها في جميع أنحاء نقاط انتشار رابط الصفحة. 
رؤية فنية 1-0: 
أعلى ٠١‏ محرك بحث الأكثر انتشارًا (أأغسطس (VANT‏ 
نعرض فيما يلي أعلى ١١‏ محركًا من محركات البحث الأكثر انتشارًا ومصدرها 

«(zmba.com/articles/search-ngines JU. eV! «$3 ebizMBA Rank) :5— 

وهو متوسط يتم تحديثه باستمرار Alexa Global Traffic Rank ggs js JI‏ و 

.Quantcastg Compete من‎ JS ġ U.S.Traffic Rank 








الترتيب محرك البحث التقدير الشهري لعدد الزوار 

eese sa Google 1 
اعم دعق‎ bing Y 
Vates xe Yahoo Search n 
FEO» Ask 3 
5 ع‎ AOL Search o 
Medie ses. Wow $ 
AEE WebCrawler ۷ 








ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري sar‏ 





























الترتيب محرك البحث التقدير الشهري لعدد الزوار 
sages MyWebSearch ۸‏ 
ESS Infospace a‏ 
MO eee Info M‏ 
AAS DuckDuckGo M‏ 
Moe Contenko Ww‏ 
Nose ss Dogpile w‏ 
iaai Alhea M‏ 
szasa ixQuick Yo‏ 














طرق تحسين محركات البحث: 

بشكل عام؛ يمكن تصنيف تقنيات تحسين محركات البحث إلى فئتين رئيستين: 
-١‏ التقنيات التي توصي بها محركات البحث كجزء من التصميم الجيد للموقع. 
؟- التقنيات التى لا تقبلها محركات البحث. 

تحاول محركات البحث تقليل تأثير النوع الثاني - والذي غالبًا ما يسمى spamdexing‏ 
(ويُعرف أيضًا باسم البحث غير المرغوب فيه م5 563161 أو محرك بحث غير مرغوب فيه 
search engine spam‏ أو تسمم محرك البحث uai o3 459 (search engine poisoning‏ 
هذه الأساليب والممارسين لها إلى قسمين: أدوات ©58 ذات قبعة بيضاء وأدوات 550 ذات قبعة 
(Goodman, 2005) £135‏ حيث تميل القبعات البيضاء إلى إفراز نتائج تدوم لفترة طويلة؛ في 
حين تتوقع القبعات السوداء حظر مواقعها في نهاية المطاف إما بشكل مؤقت أو دائم بمجرد أن 
تكتشف محركات البحث ما تفعله. 

تعتبر تقنية تحسين محركات البحث (580) قبعة بيضاء إذا كانت متوافقة مع إرشادات محرك 
البحث ولا تحتوي على أي خداع. ونظرًا لأن إرشادات محرك البحث لا تُكتب كسلسلة من القواعد 
أو الوصاياء فإن هذا تمييز مهم يجب ملاحظته. ولا يقتصر دور SEO‏ ذات القبعة البيضاء على اتباع 
الإرشادات فحسب» بل هتد إلى ضمان أن ا محتوى الذي يفهرسه محرك البحث ثم يصنف لاحقًا هو 


و ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
































التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


نفس المحتوى الذي سيراه أي مستخدم. وعادةً ما يتم تلخيص نصيحة القبعة البيضاء على أنها إنشاء 
محتوى للمستخدمين» وليس طمحركات البحث» ثم تسهيل الوصول لهذا ا محتوى بواسطة العناكب» 
بدلا من محاولة خداع الخوارزمية من الغرض المراد منها. كما يعتبر 580 ذو القبعة البيضاء أحد 
الأوجه العديدة المشابهة لتطوير الويب الذي يدعم إمكانية الوصول؛ على الرغم من تطابقهما. 

يحاول 58:0 ذو القبعة السوداء تحسين الترتيب بطرق غير مقبولة من جانب محركات 
cual‏ أو بأساليب تنطوي على شيء من الخداع. تستخدم تقنية القبعة السوداء النص المخفيء 
إما بتلوينه بنفس لون الخلفية أو بعلامة ”417“ غير مرئية أو بوضعه خارج الشاشة. وتعطي 
طريقة أخرى صفحة مختلفة اعتمادًا على كون الصفحة مطلوبة سواء بواسطة زائر بشري أو 
محرك بحث» وهي تقنية تعرف باسم إخفاء الهوية أو التغطية ع«ن)ةه!ء. كما قد تعمد محركات 
البحث إلى معاقبة ا مواقع التي تكتشفها باستخدام أساليب القبعة السوداء» إما عن طريق تقليل 
ترتيبها أو إزالة قوائمها من قواعد بياناتها تمامًا. ويمكن توقيع هذه العقوبات إما تلقائيًا من خلال 
خوارزميات محركات البحث أو من خلال مراجعة يدوية للموقع. ومن الأمثلة على ذلك: ما 
قامت به Google åS,‏ $ فبراير ٠٠١7‏ عندما قامت بإزالة كل من 82/1517 أمانيا ودامء181 أمانيا 
لقيامهما بممارسات غير معتمدة (2006 ,011415). ومع ذلكء سارعت الشركتان بتقديم الاعتذار 
وتصحيح ممارساتهماء ومن ثم تمت „Google åg JI Lole]‏ 

بالنسبة لبعض الأنشطة التجارية: قد يحقق 580 عائدًا كبيرَا على الاستثمار. ومع ذلك: يجب 
الأخذ في الاعتبار أن محركات البحث غير مدفوعة لحركة البحث المجانيء وأن خوارزمياتها تتغير 
باستمرارء ولا توجد ضمانات لاستمرار الإحالات. وبسبب هذه الحالة من عدم اليقين أو عدم 
الاستقرارء فقد تتكبد الأعمال التجارية التي تعتمد بشكل كبير على زيارات محركات البحث خسائر 
كبيرة إذا قرر محرك البحث تغيير خوارزمياته والتوقف عن استقبال الزوار. يقول غ44نتصدك5 116 
الرئيس التنفيذي لشركة »[ع600#: ”أجرت عاع000 في عام ٠‏ أكثر من 000 تغيير خوارزمية, 
أي ما يقرب من 10 تغيير في اليوم الواحد“. ونظرًا لصعوبة مواكبة قواعد محرك البحث المتغيرة 
باستمرارء فإن الشركات التي تعتمد على حركة البحث تمارس واحدًا أو أكثر من الإجراءات التالية: 
-١‏ استئجار شركة متخصصة في تحسين محركات البحث (والتي يتوافر عدد كبير منها في هذه الأيام) 

وذلك لتحسين جاذبية الموقع الخاص بها باستمرار لتغيير ممارسات محركات البحث. 
۲- تشجيع شركات محركات البحث لإدارج أسمائهم في أقسام الجهات الراعية المدفوعة. 
- النظر في التحرر من الاعتماد على حركة محرك البحث. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £30 


الفصل الخامس 


إن أهم ما بميز أي مواقع تجارة إلكترونية - سواء كانت معتمدة على محركات البحث 
(بعضوية أو بدون) أو قادمة من مواقع وأماكن أخرى - هو زيادة احتمالية معاملات العملاء إلى 
أقصى حد. ولا يعتبر وجود عدد كبير من الزائرين دون مبيعات هو ما تم تصميمه بموقع التجارة 
الإلكترونية النموذجي. وتتعلق الحالة العملية (1-0) بمركز تسوق كبير يعتمد على الإنترنت حيث 
يتم استخدام تحليل مفصل لسلوك العميل (باستخدام نقرات ومصادر البيانات الأخرى) لتحسين 


معدل التحويل بشكل ملحوظ. 


£41 


حالة عملية ۷-٥‏ 
فَهْم لماذا يؤدي التنازل عن عربات التسوق إلى زيادة مبيعات بمقدار ٠١‏ مليون دولار 

قام مركز 1016.012 وهو مركز تسوق الإنترنت الرائد à‏ كوريا والذي يضم 
١"‏ مليون عميلء بتطوير نظام متكامل لتحليل حركة زيارات الويب باستخدام 585 
لتحليلات تجربة العملاء. ونتيجة لذلكء تمكن 1,0]16.©012 من تحسين تجربة الإنترنت 
لعملائهاء فضلًا عن تحقيق عوائد أفضل من حملاتها التسويقية. والآنء يمكن للمديرين 
التنفيذيين ل 10۲.٠٥١‏ تأكيد النتائج في أي مكان وفي أي وقت» بالإضافة إلى إجراء 
تغييرات فورية. 

ومع ما يقرب من مليون زائر مموقع الويب كل يوم» 965 Lotte.com‏ بحاجة إلى معرفة 
عدد الزوار الذين يقومون بالشراء وما هي القنوات التي تجلب الزيارات الأكثر قيمة. بعد 
استعراض العديد من الحلول والأساليب المتنوعة, قدم :م.1016 نظامًا متكاملًا خاضًا 
به لتحليل حركة زيارات الويب باستخدام حل 548 لتحليل تجارب العملاء وهذا هو Jal‏ 
نظام للتحليل السلوكي على الإنترنت يطبق قي كورياء 

وباستخدام هذا النظام» کن ممرکز Lotte.com‏ قياس وتحلیل کل من أعداد زوار 
موقع الويب بدقة» والحالة الراهنة لعرض الصفحة أمام زوار ا موقع ومبرمي الصفقات» 
وشعبية كل فئة من فئات المنتجات وكذلك شعبية المنتجات نفسهاء والنقرات على 
التفضيلات الخاصة بكل صفحة: وفعالية الحملاتء وغير ذلك الكثير. أي أن هذه 
المعلومات تمكّن 1.0٤.٠٥۳‏ من فهم العملاء وسلوكهم على الإنترنت بشكل أفضلء 
وإجراء التسويق المستهدف المتطور والفعال من حيث التكلفة. 

Llsg‏ على هذا النظام قال 117:0-0001 11118[ مساعد المدير العام بفريق 
تخطيط التسويق لوقع 3:م».1.0]6: ”نتيجةً لإدخال نظام تحليل 545: تم اكتشاف 
العديد من”الحقائق الجديدة“حول سلوك العملاء وبعضها كانت «حقائق غير مريحة» 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


وأضاف: ”في الواقع كان لبعض أنشطة تخطيط الموقع التي تم الاضطلاع بها مع توقع 
نتائج معينة رد فعل ضعيف من جانب العملاءء واحتاج مخطط و ا موقع وقنًا طويا 
للتعرف على esl oda‏ 

فوائد: 

وقد أدى تقديم حلول 848 لتحليل تجربة العملاء إلى تحويل موقع الويب .ا10 
2 بشكل كامل. ونتيجة لذلكء تمكن 1.06.6013 من تحسين تجربة الإنترنت 
لعملائه بالإضافة إلى تحقيق عوائد أفضل من حملاته التسويقية. ومنذ تطبيق SAS‏ 
لتحليلات تجربة العملاءء جنى 1.0.0٥۳١‏ العديد من الفوائدء منها: 

قفزة في ولاء العملاء: 

يمكن جمع كمية كبيرة من معلومات النشاط المتطورة في إطار بيئة الزائرء ا في 
ذلك جودة الزيارات. وقال ع88[: ”إنه من خلال تحليل الزيارات الصالحة الفعلية 
والبحث في صفحة أو صفحتين فقطء يمكننا تنظيم حملات لرفع مستوى الولاء ومن 
ثم تحديد نطاق معين من التأثير. وبالإضافة لذلك من الممكن تصنيف وتأكيد معدل 
الطلب لكل قناة ومعرفة أي القنوات تحتوي على أكبر عدد من الزائرين“. 

تحليل كفاءة التسويق الأمثل: 

لا يقتصر النظام على مجرد تحليل أرقام الزائرين فقطء بل يستطيع تحليل معدل 
التحويل (عربة التسوقء الشراء الفوريء قائمة الرغبات: إتمام الصفقة) مقارنةً بالزوار 
الفعليين لكل نوع من أنواع الحملات (الانتساب أو البريد الإلكترونيء اللافتات» الكلمات 
المفتاحية» وغيرها)» لذلك يكنه أيضًا إجراء تحليل مفصل لفعالية القناة. بالإضافة 
إلى ذلك. يمكنه التأكد من كلمات البحث الأكثر استخدامًا من جانب الزوار لكل نوع 
حملة وا موقع والمنتجات المشتراة. كما يمكنه عن "the page overlay" àJl5 (3; b‏ 
قياس عدد النقرات وعدد الزوار لكل عنصر في أي صفحة لقياس قيمة كل موقع في 
الصفحة. تمكن هذه الإمكانية :م.1066 من الاستبدال أو التجديد الفوري للعناصر 
ذات الزيارات القليلة. 

رضا العملاء المحسّن وتجاربهم يؤديان إلى ارتفاع المبيعات: 

قام [0.٠٥‏ بإنشاء قاعدة بيانات تحليل سلوك العملاء التي تقيس كل زائرء 
والصفحات التي تتم زيارتهاء وكيف يتنقل الزوار في الموقع, والأنشطة التي يتم تنفيذها 
لتمكين التحليل المتنوع وتحسين كفاءة الموقع. بالإضافة إلى ذلكء تحتفظ قاعدة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري gav‏ 


الفصل الخامس 


البيانات بمعلومات عن التوزيعات السكانية للعملاء وحجم عربة التسوق ومعدل 
التحويل وعدد الطلبات وعدد المحاولات. 

وبتحليل مراحل عملية الطلب وتحديد المرحلة التي تعيق معظم العملاء ومن ثم 
تثبيت هذه المراحلء يمكن زيادة معدلات التحويل. في السابقء تم التحليل فقط على 
الطلبات الموضوعة. ومن خلال تحليل نمط حركة الزوار قبل الطلبء وعند النقطة 
التي يحدث فيها الانفصالء يمكن توقع سلوك العملاء كما يمكن القيام بأنشطة تسويق 
متطورة. ومن خلال تحليل نمط الزائرين» يمكن أن تتأثر عمليات الشراء بشكل أكثر 
فاعلية وبالتالي ينعكس طلب العملاء بشكل فوري لضمان الحصول على استجابات 
أسرع. وقد حدث تحسن في رضا العملاء لوجود فكرة أفضل os Lotte.com gu‏ 
سلوكيات واحتياجات واهتمامات كل عميل. 

وفي تقييمه للنظام: علق 028[ قائلًا: ”يمكن تحديد تحسينات في خدمة العملاء 
ومواضيع التسويق المستهدفة من خلال معرفة كيفية تحرك كل مجموعة من العملاء 
على أساس البيانات.مما ساعد على نجاح عدد من الحملات". 

ومع ذلك» فإن الفائدة الأكثر أهمية من هذا النظام هي اكتساب نظرة ثاقبة عن 
العملاء الأفراد ومجموعات العملاء المختلفة. ومن خلال فهم التوقيت الذي يبرم فيه 
العملاء صفقات الشراء وأسلوبهم في التتقل عبر صفحة الويبء يمكن الآن تحقيق 
التسويق المستهدف للقنوات وتحسين تجربة العملاء. 

بالإضافة US J)‏ فقد أدى تنفيذ 545 لتحليلات تجربة العملاء من قبل أكبر موزع 
عبر البحار لمركز 10116.00 إلى زيادة في مبيعات السنة الأولى بقيمة 8 ملايين يورو 
(أي ما يعادل ٠١‏ ملايين دولار أمريكي) من خلال تحديد أسباب هجر عربة التسوق. 

أسئلة للمناقشة: 

-١‏ كيف استخدم 1.016.601 التحليلات لتحسين المبيعات؟ 

le -Y‏ هي التحديات والحل المقترح والنتائج التي تم الحصول عليها؟ 

۳- هل تعتقد أن شركات التجارة الإلكترونية تعتبر في وضع أفضل للاستفادة من 
فوائد التحليلات؟ وماذا؟ وكيف؟ 
Sources: From Heightening customer loyalty and optimizing channels, SAS,‏ 
Customer Success Stories.sas.com/success/lotte.html (accessed March 2013).‏ 


Copyright 6 2016 SAS Institute Inc., Cary, NC, USA. Reprinted with permission. 
All rights reserved. 


ESA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


أسئلة مراجعة على القسم 6-0: 

-٥‏ ما هو محرك البحث؟ وماذا تهتم الشركات اليوم بمحركات البحث؟ 

1- ما هو زاحف الويب 259165 1165؟ وفيم يُستخدم؟ وكيف يعمل؟ 

۷- ما هو ”تحسين محرك البحث؟“ ومن الذي يستفيد منه؟ 

8- ما هي الأشياء التي يمكن أن تساعد صفحات الويب على احتلال ترتيب أعلى في نتائج محرك البحث؟ 


0-؟ التنقيب في استخدام الويب (تحليلات الويب): 
التنقيب في استخدام الويب (ويسمى أيضًا تحليلات الويب) هو استخراج معلومات مفيدة 
من البيانات التي يتم إنشاؤها من خلال زيارات صفحة الويب والمعاملات. ويمكن أن يساعدنا 
تحليل المعلومات التي يتم جمعها بواسطة خوادم الويب على فهم سلوك المستخدم بشكل أفضل. 
وغالبًا ما يطلق على تحليل هذه البيانات تحليل مسار النقر. وقد تتمكن الشركة من تمييز أنماط 
مثيرة للاهتمام من مسار النقرء وذلك من خلال استخدام تقنيات التنقيب في البيانات والنصوص. 
فعلى سبيل المثال قد تعلم أن <1١‏ من الزائرين الذين بحثوا عن ”فنادق في مأوى“ قد بحثوا 
في وقت سابق عن ”رحلات جوية إلى مأوى“. هذه المعلومات قد تكون مفيدة في تحديد مكان 
وضع الإعلانات عبر الإنترنت. كما أن تحليل مسار النقر قد يكون مفيدًا أيضًا في معرفة وقت 
وصول الزائرين إلى الموقع. فمثلًاه إذا كانت إحدى الشركات تعرف أن 2۷١‏ من تنزيلات البرامج 
من موقعها على الويب قد حدثت بين الساعة السابعة والحادية عشرة مساءً فإنها قد تخطط 
للوصول إلى دعم أفضل للعملاء وسعة تحميلية أعلى للشبكة أثناء تلك الفترة. ويعرض الشكل 
(1-0) عملية استخراج المعرفة من بيانات مسار النقر وكيف يتم استخدام تلك المعرفة لتحسين 
كل من العملية وموقع الويب» والأكثر أهمية هو رفع قيمة العميل. 











إستخراج XR‏ ت ما قبل المعالجة s‏ 
a Massy Ly‏ المستخدم 
ملفات كغريف المسةخدمن e‏ | االعميل 

Im‏ رھ تاوا دوہ 
ملفات تعريف الزيارات 1 / ) 
ig 759‏ تحديد الجهات | 
= تحديد مشأهدات الصفحة 
BII‏ تحديد الزيارات TT‏ | 
mme‏ | 
كيفية تحسين موقع الويب 
كيفية رفع قيمة العميل 


الشكل :١1-0‏ استخراج المعرفة من بيانات استخراج الويب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £44 




















الفصل الخامس 


تقنيات تحليلات الويب: 

هناك العديد من الأدوات والتقنيات لتحليلات الويب في السوق. وتزداد شعبية أدوات تحليل 
بيانات الإنترنت» نظرًا لقدرتها على قياس بيانات الإنترنت وجمعها وتحليلها لفهم الاستخدام الأمثل 
للويب وتحسينه. وتبشر تحليلات الويب بإحداث ثورة في كيفية إنجاز الأعمال على الويب» كما 
يمكن استخدامها كأداة للأعمال التجارية الإلكترونية وأبحاث السوق ولتقييم وتحسين فعالية مواقع 
الويب الخاصة بالتجارة الإلكترونية. ويمكن لتطبيقات تحليلات الويب أيضًا مساعدة الشركات في 
قياس نتائج الحملات الإعلانية المطبوعة أو الإذاعية التقليدية. وبالإضافة إلى eUS‏ فإنه يمكنها أن 
تساعد في تقدير كيفية تغير حركة ا مرور إلى موقع ويب بعد إطلاق حملة إعلانية جديدة. كما 
توفر تحليلات الويب معلومات حول عدد الزائرين مموقع الويب وعدد مشاهدات الصفحةء فضلا 
عن مساعدتها في قياس اتجاهات الحركة والرواج» والتي يمكن استخدامها في أبحاث السوق. 

وهناك فتتان رئيستان لتحليلات الويب وهما: خارج الموقع؛ وفي الموقع. وتشير تحليلات 
الويب خارج الموقع إلى قياس الويب والتحليلات عنك وعن منتجاتك التي تتم خارج موقع الويب 
الخاص بك» وهو يشمل قياس نسبة المتابعين المحتملين لوقع الويب (احتمال أو فرصة)» ومشاركة 
الصوت (الرؤية أو الكلام الشفهي)» والضجيج (التعليقات أو الآراء) الذي يحدث على الإنترنت. 

وقد كانت تحليلات الويب في الموقع هي الأكثر شيوعًا. فمن الناحية التاريخيةء أشارت تحليلات 
الويب إلى قياس نسبة زائري الموقع. ومع ذلك فقد تضاءل هذا الأمر في السنوات الأخيرة» ويرجع 
ذلك بشكل أساسي إلى أن الموردين ينتجون أدوات تمتد لتشمل كل الطبقات. وتقيس تحليلات 
الويب في الموقع سلوك الزائرين عندما يكونون على موقع الويب الخاص بك. ويشمل ذلك برامج 
التشغيل والتحويلات -مثل درجة ارتباط الصفحات المقصودة المختلفة: بالمشتريات عبر الإنترنت. 
كما تقوم تحليلات الويب الموجودة في الموقع بقياس أداء موقع الويب الخاص بك في سياق تجاري» 
ثم تتم مقارنة البيانات المجمعة على موقع الويب بمؤشرات الأداء الرئيسة للأداء واستخدامها في 
تحسين استجابة الجمهور لموقع الويب أو حملة التسويق. وعلى الرغم من أن Google Analytics‏ 
هي خدمة تحليلات الويب الأكثر استخدامًا على نطاق واسع؛ إلا أن خدمة Yahoo‏ ومايكروسوفت» 
والأدوات الجديدة والأفضل التي تظهر باستمرارء توفر طبقات إضافية من المعلومات. 

وبالنسبة إلى تحليلات الويب في cest‏ فهناك طريقتان تقنيتان لجمع البيانات. وتتمثل 
الطريقة الأولى والأكثر تقليدية في تحليل ملف سجل الخادم» حيث يقوم خادم الويب بتسجيل 
طلبات الملفات التي تقدمها المتصفحات. وأما الطريقة الثانية فتتمثل في وضع العلامات على 
الصفحات. والتي تستخدم 6م3785611[ مضمئًا في شفرة صفحة الموقع لتقديم طلبات الصور إلى 


os.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


خادم مخصص للتحليلات تابع لجهة خارجية كلما تم عرض صفحة من خلال متصفح الويب (أو 
عند حدوث نقرة ماوس). ولإنتاج تقارير المرور على شبكة الإنترنت» هكن معالجة كل من gaz‏ 
البيانات فضلًا عن هذين المسارين الرئيسينء كما يمكن أيضًا إضافة مصادر بيانات أخرى لزيادة 
بيانات سلوك موقع الويب. وقد تتضمن هذه المصادر الأخرى البريد الإلكتروني» أو بيانات حملة 
البريد المباشر, أو المبيعات» أو تاريخ القيادة, أو البيانات التي نشأت عبر وسائل التواصل الاجتماعي. 
مقاييس تحليلات الويب: 
توفر برامج تحليلات الويب الوصول إلى الكثير من البيانات التسويقية القيّمة والتي يمكن الاستفادة 
منها للحصول على إحصاءات أفضل لتنمية أعمالك وتوثيق عائد الاستثمار (1:01) بشكل أفضلء وذلك 
باستخدام مجموعة متنوعة من مصادر البيانات. ويمكن استخدام البصيرة والذكاء المكتسبة من 
تحليلات الويب لإدارة الجهود التسويقية للمؤسسة ومختلف منتجاتها أو خدماتها بفعالية. وتوفر 
برامج تحليلات الويب بيانات بشكل فوري تقريبًاء والتي يمكنها توثيق نجاحات حملاتك التسويقية: أو 
تمكينك من إجراء تعديلات في الوقت ا مناسب على إستراتيجيات التسويق الحالية. 
وفي حين أن تحليلات الويب توفر نطاقًا واسعًا من المقاييسء فهناك أربع فثات من المقاييس قابلة 
للتطبیق بشكل عام وکن أن تؤثر بشكل مباشر على أھداف أعمالك )2013 „(The Westover Group,‏ 
وتشمل هذه الفثات ما ياي: 
- سهولة استخدام موقع الويب: كيف كانوا يستخدمون الموقع الخاص بي على الويب؟ 
- مصادر الزيارات: من oJ‏ أتوا؟ 
- ملامح الزوار: كيف يبدو زوار موقعي؟ 
- إحصائيات التحويل: ماذا يعني كل هذا للأعمال؟ 
قابلية استخدام موقع الويب: 
بداية من موقع الويب الخاص بك دعنا نلقي نظرة على مدى نجاحه مع زوارك. فهذا هو 
المكان الذي يمكنك من خلاله معرفة مدى «سهولة استخدامه» بالفعل أو ما إذا كان المحتوى 
الذي يقدمه مناسبًا آم لا. 
-١‏ استعراضات الصفحة: وهو أبسط القياسات» ويتم تقديم هذا ا مقياس عادةً على أنه ”متوسط 
عدد مشاهدات الصفحة لكل زائر“. فإذا جاء الأشخاص إلى موقعك على الويب وم يشاهدوا 
العديد من الصفحاتء فقد يواجه موقعك الإلكتروني مشكلات في تصميمه أو بنيته. وهناك 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 01 


الفصل الخامس 


تفسير آخر لانخفاض عدد مشاهدات الصفحة وهو قطع الرسائل التسويقية التي جلبتها إلى 
الموقع والمحتوى المتاح بالفعل. 

۲- الوقت على الموقع: ويشبه مرات مشاهدة الصفحةء فهو مقياس أساسي لتفاعل الزائر مع 
موقع الويب الخاص بك. وبشكل عام» فكلما زاد إنفاق الشخص على موقع الويب الخاص 
به. كان ذلك أفضل. وقد يعني ذلك أنهم يراجعون المحتوى الخاص بك بعناية. مستخدمين 
المكونات التفاعلية المتوفرة لديك» والبناء للوصول إلى قرار مستنير للشراء أو الاستجابة أو 
اتخاذ الخطوة التالية التي قدمتها. وعلى العكس من ذلكء فإنه يجب أيضًا فحص الوقت 
المستغرق في الموقع مقابل عدد الصفحات التي تم عرضها للتأكد من أن الزائر لا يقضي وقته 
في محاولة العثور على محتوى يسهل الوصول إليه. 

۳- التنزيلات: يتضمن ذلك ملفات ۶5۴ ومقاطع الفيديو وال موارد الأخرى التي توفرها لزائريك. 
ولا بد أن تضع في اعتبارك مدى سهولة الوصول إلى هذه العناصر وكذلك مدى الترويج لها. 
فمثلا. إذا كانت إحصائيات الويب الخاصة بك تكشف أن 1۰ من الأفراد الذين يشاهدون 
فيديو تجريبي يقومون أيضًا بعملية شراءء فحينئذ سترغب في وضع إستراتيجية لزيادة نسبة 
المشاهدة لهذا الفيديو. 

6- خريطة النقر: يمكن لمعظم برامج التحليلات عرض النسبة المئوية للنقرات التي حصل عليها 
كل عنصر على صفحة الويب الخاصة بك. ويتضمن هذا صورًا قابلة للنقرء وروابط نصية في 
نسختك» وتنزيلات» وبالطبع أيضًا أي تنقل قد يكون لديك على الصفحة. هل يقومون بالنقر 
على العناصر الأكثر أهمية؟ 

ه- مسارات النقر: على الرغم من أن تقييم مسارات النقر ينطوي على مزيد من المشاركة: إلا 
أنه يمكنه الكشف بسرعة أين يمكن أن تفقد الزوار في عملية محددة. ويستخدم موقع ويب 
المصمم بشكل جيد مزيجًا من بنية الرسومات والمعلومات لتشجيع الزائرين على اتباع المسارات 
”المحددة مسبقًا“ من خلال موقع الويب الخاص بك. وهذه المسارات ليست صلبة ولكنها 
خطوات بديهية تتوافق مع مختلف العمليات التي قمت بإنشائها في موقع الويب. وقد تكون 
إحدى هذه العمليات هي ”تعليم“ الزائر الذي لديه أدنى فهم لمنتجك أو خدمتك. وقد تكون 
الأخرى عملية ”تحفيز“ للزائر الذي يعيد النظر مرة أخرى في تحديث أو إعادة شراء. LÍ‏ 
العملية الثالثة فقد يتم تنظيمها حول العناصر التي تسوقها عبر الإنترنت. وسوف يكون لديك 
العديد من مسارات العمليات في موقع الويب الخاص بك كما يكون لديك الجماهير ا مستهدفة 
وا منتجات والخدمات: ويمكن قياس كل منها من خلال تحليلات الويب لتحديد مدى فعاليتها. 


oY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


مصادر الزيارات: 

برنامج تحليلات الويب الخاص بك هو أداة لا تصدق لتحديد مكان الزيارات الخاصة بك على 
الويب. ويتم تصنيف الفئات الأساسية مثل محركات البحث ومواقع الويب المرجعية والزيارات 
من الصفحات التي تم وضع إشارة عليها (مثل: المباشرة) مع القليل من مشاركة المسوق. كما 
يمكنك أيضًا تحديد زيارات الويب التي تم إنشاؤها بواسطة حملاتك الإعلانية المتعددة غير 
المتصلة أو عبر الإنترنت» بقليل من الجهد. 


èlse òl ‘Referral مواقع الويب التي تقوم بإحالة الزائرين إلى موقع الويب الخاص بك‎ -١ 
الويب التي تحتوي على روابط تقوم بإرسال الزائرين مباشرة إلى موقع الويب الخاص بك‎ 
تعتبر مواقع ويب مرجعية» وسيقوم برنامج التحليلات الخاص بك بتحديد كل موقع يتم‎ 
إرسال الزيارة لك منهء كما يوجد تحليل أعمق سيساعدك على تحديد الإحالات التي تنتج‎ 
الحجم الأكبرء والتحويلات الأعلى؛ والزوار الأحدث؛ وما إلى ذلك.‎ 

- محركات البحث: يتم تقسيم البيانات في فئة محركات البحث بين البحث مدفوع الثمن 
والبحث الأساسي (أو الطبيعي). ويمكنك مراجعة أهم الكلمات المفتاحية التي أنتجت الزيارة 
إلى موقعك ومعرفة ما إذا كانت هذه الكلمات تمثل منتجاتك وخدماتك أم لا. واعتمادًا 
على عملك قد ترغب في الحصول على مئات (أو آلاف) الكلمات المفتاحية التي تحدد ملامح 
العملاء المحتملين. وحتى أبسط بحث عن المنتج يمكن أن يكون بمتغيرات تعتمد على شكل 
العبارات الفردية في طلب البحث. 

“- المباشرة: وتنسب عمليات البحث المباشرة إلى مصدرين. يتمثل الأول في الشخص الذي يضع 
إشارة مرجعية على إحدى صفحات الويب الخاصة بك في صفحاته ا لمفضلة ويضغط على هذا 
deal JI‏ فيتم تسجيله كبحث مباشر. أما المصدر الثاني فيتمثل في كتابة شخص ما لعنوان URL‏ 
الخاص بك مباشرة في متصفحه. ويحدث هذا عندما يسترد شخص ما عنوان 0۸1 الخاص بك 
من بطاقة عمال أو كتيب أو إعلان مطبوع أو إعلان راديو وما إلى ذلك وهذا هو السبب في 
كونها إستراتيجية جيدة لاستخدام عناوين 0۸1 المشفرة. 

ع- حملات ليست عبر الإنترنت: إذا كنت تستخدم خيارات الإعلان إلى جانب الحملات القائمة 
على الويب» فيمكن لبرنامج تحليلات الويب الخاص بك التقاط بيانات الأداء إذا قمت بتضمين 
آلية لإرسالها إلى موقع الويب الخاص بك. وعادةً ما يكون هذا العنوان .17181 المخصص 
الذي قمت بتضمينه في الإعلان الخاص بك (^www.mycompany.com/offer50" :J2s)‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oy‏ 


الفصل الخامس 


هو العنوان الذي يقدم هؤلاء الزوار لصفحة معينة. ويصبح لديك الآن بيانات حول عدد 
المستجيبين لذلك الإعلان عن طريق زيارة موقع الويب الخاص بك. 

0- حملات عبر الإنترنت: إذا كنت تعتمد على اللافتات الإعلانيةء أو إعلانات على محرك بحثي» أو 
حتى حملة بريد إلكترونيء فيمكنك قياس فعالية تلك الحملات الفردية بمجرد استخدام عنوان 
URL‏ مخصص مشابه لإستراتيجية الحملة التي لا تعتمد على الإنترنت. 


الملفات الشخصية للزوار: 
وهي إحدى الطرق التي يمكنك من خلالها الاستفادة من تحليلات الويب الخاصة بك وتحويلها 

إلى أداة تسويقية حقيقية وذلك من خلال التقسيم إلى شرائح. ومن خلال مزج البيانات من تقارير 

التحليلات المختلفة. ستبدأ في مشاهدة مجموعة متنوعة من ال ملفات الشخصية للمستخدمين. 

-١‏ الكلمات المفتاحية: فمن خلال تقرير التحليلات الخاص بكء يمكنك معرفة الكلمات المفتاحية 
التي يستخدمها الزوار في محركات البحث لتحديد موقع الويب الخاص بك. فإذا قمت بتجميع 
كلماتك الرئيسة بسمات مشابهة: فإنك ستبدأ في رؤية مجموعات مميزة من الزوار تستخدم 
موقع الويب الخاص بك. فمثلاء يمكن أن تشير عبارة البحث المحددة التي تم استخدامها إلى 
مدى فهمهم لمنتجك أو فوائده. وإذا استخدموا الكلمات التي تعكس وصف المنتج أو الخدمة 
الخاصة بكء فهذا يعني أنهم قد يكونون بالفعل على علم بالعروض الخاصة بك من الإعلانات 
الفعالة والكتيبات وما إلى ذلك. وإذا كانت الشروط أكثر عمومية بطبيعتهاء فإن زائرك يبحث 
عن حل لمشكلة ما وقد حصل على موقع الويب الخاص بك. وإذا كانت هذه المجموعة الثانية 
من الباحثين كبيرة الحجم» فإنك ستحتاج إلى التأكد من أن موقعك يحتوي على مكون تعليمي 
قوي لإقناعهم بأنهم قد وجدوا إجابتهم ومن ثم نقلهم إلى قناة مبيعاتك. 

-'١‏ تجمعات المحتوى: فمن خلال الاعتماد على كيفية تجميع المحتوى الخاص بكء قد تتمكن من 
تحليل أقسام موقع الويب الخاص بك والتي تتوافق مع منتجات وخدمات وحملات وأساليب 
تسويقية أخرى. فإذا كنت تدير الكثير من المعارض التجارية وزادت الزيارات إلى موقع 
الويب الخاص بك بحتًا عن المنشورات الخاصة نتج معين» فإن تحليلات الويب الخاصة بك 
سوف تقوم بتسليط الضوء على النشاط في ذلك القسم. 

-٠‏ الجغرافيا: حيث تسمح لك التحليلات بمعرفة المكان الذي تنبع منه الزيارات جغرافيًاء ا في 
ذلك البلد والولاية والمدينة. وقد يكون هذا مفيدًا بالنسبة لك خاصةً إذا كنت تستخدم حملات 
تستهدف مواقع جغرافية معينة أو كنت تريد قياس مشاهداتك في منطقة ما. 


ost‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


ع- فترات اليوم: فعادةً ما تصل زيارات الويب إلى ذروتها في بداية يوم العمل وخلال وقت القداء 
وفي نهاية يوم العمل. ومع ذلك» وليس من المعتاد إيجاد زيارة قوية إلى موقع الويب الخاص 
بك في وقت متأخر من المساء. ويمكنك تحليل هذه البيانات لتحديد مواعيد تصفح الناس في 
مقابل الشراء وأيضًا اتخاذ القرارات بشأن الساعات التي يجب أن تقدم فيها خدمة العملاء. 

0- خصائص صفحات مطلوبة للبحث: فإذا قمت بتنظيم حملاتك الإعلانية المختلفة بشكل 
صحيح» فإنه يمكنك توجيه كل مجموعة من مجموعاتك المستهدفة إلى صفحة مقصودة 
مختلفة» والتي ستقوم تحليلات الويب الخاصة بك بالتقاطها وقياسها. ومن خلال الجمع بين 
هذه الأرقام والتوزيعات السكانية لوسائل الحملة الخاصة بكء يمكنك معرفة النسبة المئوية 
للزوار التي تناسب كل فئة سكانية. 


إحصائيات التحويل: 
سوف تقوم كل منظمة بتعريف «التحويل» وفقًا للأهداف التسويقية الخاصة بها. وتستخدم 

بعض برامج التحليلات مصطلح هدف (8031) لقياس أهداف موقع ويب معين: سواء كان ذلك عددًا 

معيئًا من الزائرين لصفحة ما أو نموذج تسجيل تام أو عملية شراء عبر الإنترنت. 

-١‏ الزوار الجدد: فإذا كنت تعمل على زيادة مستوى الرؤية» فإنك ستحتاج إلى دراسة المؤشرات 
في بيانات الزائرين الجدد. حيث يصنف برنامج التحليلات جميع الزوار على أنهم إما جُدد أو 
مترددين على ا موقع. 

۲- رجوع الزوار: فإذا كنت تشارك في برامج الولاء أو تقدم منتجًا يحتوي على دورة شراء طويلة 
فستساعدك بيانات زوارك العائدين في قياس التقدم في هذا المجال. 

-٠‏ القيادات: فبمجرد تقديم نموذج وتوليد صفحة شكرء فإنك بذلك قد تكون جذبت قائد. حيث 
تسمح لك تحليلات الويب بحساب معدل الإكمال (أو معدل التخلي) عن طريق قسمة عدد 
النماذج المكتملة على عدد زائري الويب الذين جاءوا إلى صفحتك. وتشير النسبة المئوية 
للإكمال المنخفض إلى أن الصفحة تحتاج إلى الاهتمام. 

#- المبيعات / التحويلات: اعتمادًا على هدف موقع الويب الخاص بكء يمكنك تحديد ”البيع“ من 
خلال صفقة عبر الإنترنت» أو تسجيل مكتملء أو تقديم عبر الإنترنت» أو أي عدد من أنشطة الويب 
الأخرى. ومراقبة هذه الأرقام سوف تنبهك إلى أي تغييرات (أو نجاحات!) تحدث في مراحل أعلى. 

ه- معدلات المغادرة / الخروج: وهي لا تقل أهمية عن معدلات التحرك من موقع الويب الخاص 
بكء ويقصد بها معدلات الأشخاص الذين بدأو عملية التحرك في الموقع ثم قاموا بإنهائها. أو 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 0-0 


الفصل الخامس 


وصلوا إلى موقع الويب الخاص بك وتركوه بعد صفحة أو اثنتين. ففي الحالة الأولى» ستحتاج 
إلى تحليل المكان الذي أنهى فيه الزائر العملية وما إذا كان هناك عدد من الزائرين يغادرون 
في المكان نفسه. ومن ثَّم التحقيق في الوضع من أجل اتخاذ القرار. وفي الحالة الأخيرة يشير 
معدل الخروج المرتفع من موقع ويب أو صفحة ما بشكل عام إلى وجود مشكلة في التوقعات. 
ويقوم الزائرون بالنقر على موقع الويب الخاص بك استنادًا إلى بعض الرسائل الواردة في الإعلان» 
والعرض التقديميء وما إلى ذلك» ومن المتوقع استمرار هذه الرسالة بعض الوقت. وينبغي عليك 
أن تتأكد من أنك تعلن الرسالة التي يستطيع موقعك على الويب أن يعززها ويسلمها. 
ويتضمن كل بند من هذه العناصر مقاييس يمكن إنشاؤها للمؤسستك. كما يمكنك إنشاء 
لوحة معلومات أسبوعية تتضمن أرقامًا أو نسبًا محددة تشير إلى المكان الذي تنجح فيه - 
أو تسلط الضوء على التحدي التسويقي الواجب معالجته. وعندما يتم تقييم هذه المقاييس 
باستمرار واستخدامها مرتبطةً ببيانات تسويقية أخرى متاحة» فمن الممكن أن يقودك ذلك إلى 
برنامج تسويق كمي للغاية. ويعرض الشكل )١15-0(‏ لوحة تحكم في تحليلات الويب تم إنشاؤها 
Bless à» L1 Google Analytics cls»l elaszal‏ 








177 30.42% 


p GOJA ANDAS O iee tentas 


P 





- مح‎ NER : 
. پپپ ڪڪ‎ - 
j Google ranya 


شكل :١6-0‏ عينة لوحة معلومات لتحليلات الويب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التنبؤية (۲): تحليلات النص والويب ووسائل التواصل الاجتماعي 


أسئلة مراجعة على القسم 3-0: 
-١‏ ما هي الأنواع الثلاثة للبيانات التي يتم توليدها من خلال زيارات صفحة الويب؟ 
؟- ما هو تحليل مسار النقر؟ وفيم يستخدم؟ 
“- ما هي التطبيقات الرئيسة للتنقيب في الويب؟ 
ع- ما هي مقاييس تحليلات الويب شائعة الاستخدام؟ وما أهمية المقاييس؟ 
٠١-0‏ التحليلات الاجتماعية: 

يتفاوت معنى التحليلات الاجتماعية من شخص لآخرء وفقاً لنظرته إلى العام وإلى مجال 
دراسته. فعلى سبيل المثال يشير تعريف القاموس للتحليلات الاجتماعية إلى وجهة نظر فلسفية 
وضعها المؤرخ والفيلسوف الدنماركي غلنصتدك5 علق1م18:5-116 في تمانينيات القرن العشرين. 
ويعد الهدف النظري من وجهة النظر هذه هو 15اك“50: وهو نوع من ”الشمولية“ التي لا تمثل 
حسابًا عالميًا ولا مشاركة مجتمعية بین كل عضو في كيان ما (1996 i4‏ طء؟). وهكذاء تختلف 
التحليلات الاجتماعية عن كل من الفلسفة التقليدية وعلم الاجتماع والتي قد ينظر إليها على أنها 
ا محاولات الرامية إلى توضيح الخلاف بين الفلسفة وعلم الاجتماع. 

ويختلف تعريفنا للتحليلات الاجتماعية إلى حد ما. فبدلًا من التركيز على الجزء «الاجتماعي» 
(كما هو الحال ف التعريف الفلسفي له)» فنحن نهتم أكثر بجزء «التحليلات» في المصطلح. وقد 
قامت شركة 621161 (وهي شركة استشارية عالمية معروفة في مجال تقنية المعلومات) بتعريف 
التحليلات الاجتماعية على أنها «رصد وتحليل وضبط وتفسور التفاعلات الرقمية والعلاقات بين 
الأشخاص وامواضيع والأفكار (gartner.com/it-glossary/social-analytics/) «5:2Lls‏ 
وتشمل التحليلات الاجتماعية التنقيب في محتوى النص الذي تم إنشاؤه في وسائل التواصل 
الاجتماعي (مثل تحليل المشاعرء ومعالجة اللغات الطبيعية 271:2) وتحليل الشبكات الاجتماعية 
(مثل تحديد المؤثرء والتنميط: والتنبؤ) وذلك بغرض الحصول على إحصاءات حول السلوكيات 
الحالية والمستقبلية للعملاء الحاليين والمحتملينء وحول شعورهم بالإعجاب أو عدم الإعجاب 
تجاه منتجات وخدمات الشركة. واستنادًا إلى هذا التعريف وال ممارسات الحالية» يمكن تصنيف 
التحليلات الاجتماعية إلى فرعين مختلفين - غير أنه ليس بالضرورة أن يكون هذين الفرعين 
حصريين - وهما: تحليل الشبكات الاجتماعية (5214) وتحليلات وسائل التواصل الاجتماعي. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 0۷ 


الفصل الخامس 


تحليل الشبكة الاجتماعية: 
تعتبر الشبكة الاجتماعية هيكل اجتماعي يتكون من أفراد / أشخاص (أو مجموعات من 
الأفراد أو المنظمات) ترتبط ببعضها البعض بنوع من الروابط / العلاقات؛ حيث يقدم منظور 
الشبكة الاجتماعية طريقة شاملة لتحليل بنية وديناميكيات الكيانات الاجتماعية. وتستخدم 
دراسة هذه الهياكل نظام الحسابات القومية لتحديد الأنماط المحلية والعالمية» وتحديد الكيانات 
ا مؤثرةء ودراسة ديناميكية الشبكة. والجدير بالذكر أن الشبكات الاجتماعية وتحليلها هي في 
الأماس مجال متعدد التخصصات نشأ من علم النفس الاجتماعي» وعلم الاجتماع» والإحصاءات» 
ونظرية الرسم البياني. ويعود تاريخ تطوير وإضفاء الطابع الرسمي على المدى الرياضي لنظام 
الحسابات القومية إلى الخمسينيات» في حين أن تاريخ تطوير النظريات والأساليب الأساسية 
للشبكات الاجتماعية يعود إلى ثمانينيات القرن العشرين(2003 ,103515 86 56006). ويُّعد نظام 
الحسابات القومية الآن واحداً من النماذج الرئيسة ف تحليلات الأعمالء وذكاء المستهلك وعلم 
الاجتماع المعاصرء كما يستخدم أيضًا في عدد من العلوم الاجتماعية والرسمية الأخرى. 
إن الشبكة الاجتماعية هي بنيان نظري مفيد في العلوم الاجتماعية لدراسة العلاقات بين 
الأفراد والجماعات والمنظمات, أو حتى مجتمعات بأكملها (الوحدات الاجتماعية). ويستخدم 
المصطلح لوصف البنية الاجتماعية التي تحددها مثل هذه التفاعلات. حيث تمثل الروابط التي 
ترتبط بها أي وحدة اجتماعية معينة تقارب مختلف جهات التواصل الاجتماعي لتلك الوحدة. 
وبشكل عام» فإن الشبكات الاجتماعية ذاتية التنظيم» ناشئة ومعقدة بحيث aio‏ مط متماسك 
oa Eble‏ التفاعل المحلي للعناصر (الأفراد ومجموعات الأفراد) التي تشكل النظام. 
وفيما يلي بعض أنواع الشبكات الاجتماعية النموذجية المرتبطة بأنشطة الأعمال: 
- شبكات الاتصالات: تُعتبر دراسات الاتصال في الغالب جزءً! من كلّ من العلوم الاجتماعية 
والإنسانيةء وتعتمد إلى حد كبير على مجالات Jis‏ علم الاجتماع وعلم النفس وعلم الإنسان 
(الأنثروبولوجي) وعلم المعلومات والأحياء (البيولوجي) والعلوم السياسية والاقتصاد. وتفيد 
العديد من مفاهيم الاتصالات في وصف عملية نقل المعلومات من مصدر إلى آخر وبالتالي يمكن 
تمثيلها كشبكة اجتماعية. حيث تستفيد شركات الاتصالات من هذا المصدر الغني بالمعلومات 
لتحسين ممارسات الأعمال الخاصة بها وكذلك تحسين علاقات العملاء. 
- شبكات ال مجتمع: يشير مصطلح المجتمع تقليديًا إلى موقع جغرافي معين» وكانت دراسات العلاقات 
المجتمعية تتعلق بمن تحدثواء وترابطواء وتاجرواء وحضروا نشاطات اجتماعية مع بعضهم البعض. 
ومع ذلكء هناك اليوم مجتمعات ”إلكترونية“ موسعة تم تطويرها من خلال أدوات التواصل 


0۸ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


الاجتماعي وأجهزة الاتصالات. مثل هذه الأدوات والأجهزة تنتج باستمرار كميات كبيرة من 
البيانات» والتي يمكن استخدامها من قبل الشركات لاكتشاف معلومات نفيسة وقابلة للتطبيق. 

- الشبكات الإجرامية: في علم الجريمة وعلم الاجتماع المدنيء تم توجيه اهتمام كبير للشبكات 
الاجتماعية من بين الممثلين الإجراميين. فمثلًاه قد تؤدي دراسة جرائم القتل التي تقوم 
بها العصابات والأنشطة غير القانونية الأخرى - باعتبارها سلسلة من عمليات التناوب بين 
العصابات - إلى فهم أفضل لهذه الأنشطة الإجرامية ومن ثم العمل على منعها. والآن وبعد 
أن أصبحنا نعيش في عام مترابط إلى حد كبير (بفضل الإنترنت)» تقوم وكالات الأمن بمراقبة / 
متابعة الكثير من تشكيلات الشبكات الإجرامية وأنشطتها باستخدام أدوات وتكتيكات الإنترنت 
الحديثة. وعلى الرغم من أن الإنترنت قد غيّر شكل شبكات الإجرام والوكالات المنوطة بتطبيق 
القانون» إلا أن النظريات الاجتماعية والفلسفية التقليدية لا تزال تطبق إلى حد كبير. 

- شبكات الابتكار: تركز دراسات الأعمال على نشر الأفكار والابتكارات في بيئة الشبكات على انتشار 
الأفكار واستخدامها بين أعضاء الشبكة الاجتماعية. وتكمن الفكرة في فهم سبب كون بعض الشبكات 
أكثر إبداعاء وماذا تتبلّى بعض المجتمعات تلك الأفكار والابتكارات في وقت مبكر (مثل دراسة أثر 
هيكل الشبكة الاجتماعية في التأثير على انتشار الابتكار والسلوك الإبداعي). 


مقاييس تحليل الشبكة الاجتماعية: 
إن نظام تحليل الشبكة الاجتماعية 5214 هو الفحص المنتظم للشبكات الاجتماعية. وينظر نظام 
تحليل الشبكة الاجتماعية إلى العلاقات الاجتماعية من حيث نظرية الشبكة؛ والتي تتكون من عُقد 
695 (تمثل الأفراد أو المنظمات داخل الشبكة) والعلاقات / الاتصالات (التى تمثل العلاقات بين 
الأفراد أو ا منظمات» مثل الصداقة أو القرابة أو الوضع التنظيمي). وغالبًا ما يتم تمثيل هذه الشبكات 
باستخدام الرسوم البيانية للشبكة الاجتماعية» حيث يتم تمثيل aal‏ (نقاط الالتقاء) كنقاط ويتم تمثيل 
الروابط كخطوط. وتقدم الحالة العملية (6-0) مثالًا مثيرًا للتحليلات الاجتماعية متعددة القنوات. 
حالة عملية ۸-٥‏ 
فودكا تيتو تؤسس الولاء للعلامة التجارية بإستراتيجية اجتماعية حقيقية 
إذا كان على الفودكا المصنوعة يدويًا من تيتو 1110" تحديد مقياس واحد لوسائل 
التواصل الاجتماعي يعكس مهمتها بدقة أكبر» فربما يكون المشاركة. إن التواصل مع 
محبي الفودكا بطريقة شاملة وأصيلة هو أمر تأخذه تيتو 1110 بجدية بالغة. وتعكس 
الإستراتيجية الاجتماعية للعلامة التجارية تلك الرؤية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 6 


الفصل الخامس 


وقد كان تأسيسها منذ ما يقرب من عقدين من الزمان. وقد ساعد ظهور وسائل 
التواصل الاجتماعي في تعزيز العلامة التجارية من خلال لعب دور أسامي في إشراك 
الجمهور وزيادة الوعي بالعلامة التجارية. وفي مقابلة مع صاحب المشروع: ذكر 
أن 867611086 8616 مؤسس شركة تيتو «11]0“. قد نسب الفضل لوسائل التواصل 
الاجتماعي لتمكينه من التنافس على مساحة العرض على الرفوف مع علامات تجارية 
أخرى للخمور أكثر شهرةء حيث قال 8676148 لصاحب المشروع: ”وسائل التواصل 
الاجتماعي هي منصة كبيرة للترويج لعلامة تجارية من خلال الكلمة الشفوية: لأنها 
ليست فقط ين لديه أكبر مكبر للصوت"“. 

ومع نضج شركة تيتو Tito‏ ظل الفريق الاجتماعي مخلصًا للقيم التأسيسية للعلامة 
التجارية ويستخدم كلا من cloy blis Instagram Twitter‏ محادثات فردية 
وتواصل مع المتحمسين للعلامة التجارية. وقالت 6610211565 :181 منسقة شبكة 
الإنترنت ووسائل التواصل الاجتماعي: ”نحن لم ننظر Íj‏ لوسائل التواصل الاجتماعي 
على اعتبار أنها وسيلة أخرى للإعلان“. وتابعت: ”نحن موجودون على هذه الوسائل 
الاجتماعية حتى يتمكن عملائنا من التحدث إلينا". 

وللوصول لهذه النهاية تستخدم تيتو 11340 وسائل التواصل الاجتماعي الحديثة 
لفهم جو الصناعةء وتطوير علامة تجارية اجتماعية متسقة: وإنشاء حوار مع جمهورها. 
ونتيجة لذلك» فقد قامت تيتو 1160 بتنمية مجتمعاتها عضونًا على كل من 1۷)6۲" 


بنسبة 61,0 و105]8817812 بنسبة 11,1 وذلك في غضون © أشهر. 
V Handmade‏ 222 
Titos. © VODKA‏ 


sproutsocal ® و‎ 
5 M , 


E ; 
Titos z 4 


D 








الإخبار بإستراتيجية التسويق الموسمية المتكاملة: 

يمثل برنامج كوكتيل الربع سنوي لتيتو 1110 جزءًا ريسا من إستراتيجية التسويق 
المتكاملة للعلامة التجارية؛ حيث يتم تطوير وصفة كوكتيل في كل ربع سنة وتوزيعها 
من خلال مبادرات التسويق عبر الإنترنت في 523 Tito‏ 


ov‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


ومن امهم بالنسبة Tito gu‏ ضمان توافق الوصفة مع تركيز العلامة التجارية فضلًا 
عن الاتجاه إلى صناعة أكبر. ولذلكء تستخدم 661311565 الكلمات المفتاحية لعلامة 
81014 لراقبة اتجاهات الصناعة وملفات تعريف نكهة الكوكتيل. تقول :Gelhausen‏ 
A3"‏ كان جهاز ؛نا0ه2م5 أداة soU li> iage‏ الاجتماعي. uy ib Inbox sùg‏ 
للاحتفاظ بأعلى علامات التصنيف والاطلاع على المؤشرات العامة في جدول واحد“. 


ez‏ تقديم هذه الدروس إلى فريق عمل ا مزيج الداخلي ف تيتو 11۲١‏ واستخدامها لضمان 
توصيل نفس الوصفة الربع سنوية إلى فريق مبيعات العلامة التجارية وعبر قنوات التسويق. 
تقول 61811562 6: ”سواء كنت تشرب تيتو 1310 في البار أو تشتريه من متجر لبيع الخمور 
أو تتابعنا على مواقع التواصل الاجتماعي فإنك تحصل على نفس الكوكتيل الربع سنوي“. 

يضمن البرنامج حصول الشخص على تجربة متسقة للعلامة التجارية: في كل نقطة 
اتصال للمستهلك» وهذا الاتساق أمر حيوي. وف الواقع» فإنه وفقًا لدراسة أجرتها شركة 
a XVE Ol omnichannel lsj35 (5l (35 I à ,23 Js 7 Infosys‏ ا لمستهلكين 
يرون أن الاتساق بين القنوات هو سبب إنفاقهم أكثر مع علامة تجارية. وعلى الجانب 
الآخر ذكر 9 أن التناقض يُعد سببًا كافيًا لإنفاق مبالغ أقل. 

ويبدأ جمع رؤى الصناعة في شركة تيتو 1110 بمراقبة اجتماعية على Twitter‏ 
Sprout J> g Instagram g‏ غير أن الإستراتيجية الاجتماعية للعلامة التجارية لا 
تتوقف عند هذا الحدء حيث تستخدم تيتو 13]0' النظام الأماسي بشكل يومي للتواصل 
فعليًا مع عملائها. مع الحفاظ على جذورها. 

ويقوم صندوق البريد الذكي ( Sprout‏ بعرض حسابات Instagrams Twitter‏ 
الخاصة بتيتو 11:0' في خلاصة واحدة ومتماسكة: مما يساعد 61811565 على إدارة 
الرسائل الواردة والتحديد بشكل سريع أي منها يتطلب استجابة. 

يقول 661811568: ”يتيح لنا برنامج 5050116 البقاء على اتصال دائم بالمحادثات 
التي نجريها مع متابعينا. وأنا أحب إمكانية التفاعل بسهولة مع المحتوى من حسابات 
متعددة في مكان واحد“. 

انتشار الكلمة على تويتر: 

X ss‏ الطريقة التي تتبعها تيتو ule Tito‏ تويتر بسيطة. حيث إنها تتمثل في 
الانخراط في محادثات شخصية فردية مع المعجبين. ويعد الحوار قوة دافعة للعلامة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oM‏ 


الفصل الخامس 


التجارية» وعلى مدار 6 أشهرء كانت نسبة 2۸۸ من التغريدات التي تم إرسالها تمثل 
ردودًا على الرسائل الواردة. 

وقد أدى استخدام :1601116" كخط اتصال بين تيتو 1360" ومعجبيها إلى زيادة التفاعل 
بنسبة 171,8 بالإضافة إلى زيادة المتابعين بنسبة 6,0“. وما يثير الإعجاب أكثر هو 
إنهاء تيتو 11١‏ هذا الربع السنوي بواقع 018,07 انطباعًا من الأعضاء - وهو ارتفاع 
بنسبة .4۸١‏ كما يتم تطبيق إستراتيجية مشابهة على 1756381272 حيث تستخدمها 
تيتو 11]0' لتعزيز وتقوية العلاقة مع المعجبين وذلك من خلال نشر الصور ومقاطع 
الفيديو لأفكار الوصفات الجديدة وأحداث العلامة التجارية وا مبادرات. 

الاستيلاء على الحفل على :Instagram‏ 

تقوم تيتو 1110 في الأساس بنشر محتوى نمط الحياة على 1051287212 وتشجع 
المتابعين لدمج العلامة التجارية في المناسبات اليومية. كما تستخدم تيتو Lj Tito‏ 
النظام الأماسي للترويج لجهودها التسويقية ولإخبار قصة علامتها التجارية. ويعثر 
الفريق على قيمة في تقرير 125]3817312 الخاص ب 505011: والتي تساعدهم على 
تحديد أكثر الأشياء التي تحظى بالمشاركة على وسائل التواصل وتلقي أكبر قدر من 
التفاعل وتحليل تركيبة الجمهور ومدى زيادتهم: والغوص في أنماط النشر بشكل أعمق» 
وتقييم أداء الوسم (25428) الصادر. وفي هذا الصدد يقول 1210562 6: ”في ضوء 
الخلاصة المخصصة الجديدة في «نةرعه5م]: من المهم أن ننتبه لما يحدث بالفعل“. 

وقد تمكنت تيتو 17310 باستخدام تقرير SÍ okë go Instagram‏ إستراتيجيتها 
lazo) J 24535 Instagram sgul‏ وفقًا لذلك. ومن خلال استخدام الشبكة 
كطريقة أخرى للتفاعل مع ael‏ تت علامتها التجارية بشكل مطرد مع نمو جمهورها. 
ds‏ غضون 6 أشهر شهدت 11051700186 زيادة في اممتابعين بنسبة 4۱۲,١‏ وزيادة في 
التفاعل بنسبة ١,لا/#.‏ كما حصل كل محتوى منشور على متوسط ٥۳٤‏ تفاعلًد كما نما 
XYY du titoshandmadevodka?£ à» jJ] 4sM3Jb yola (hashtag) owg)!‏ 


من هنا يؤدي إلى أين؟ 

تعد وسائل التواصل الاجتماعي استثمارًا متواصلًا في الوقت والاهتمام. وستواصل 
تيتو 190 النشاط الذي شهدته علامتها التجارية من خلال تقسيم كل ربع سنة 
في حملتها الخاصة. يقول 6©8ةناقطاء6: ”نحن داتا نصبح أكثر ذكاءَ من خلال 


ow‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


إستراتيجياتنا الاجتماعية ونحرص على أن يكون ما ننشره ملائما ونتلقى صداه“. وسيظل 
استخدام التواصل الاجتماعي مع المعجبين بطريقة ثابتة وأصلية ولا تنسى حجر الزاوية 
في جهود التسويق الرقمي للعلامة التجارية. وستواصل تيتو 110 تعزيز مجتمع محبيها 
01155 باستخدام مجموعة أدوات إدارة وسائل التواصل الاجتماعي في 10106م5. 





- توجد زيادة بنسبة 1717“ في التفاعل „Twitter de gL‏ 

Twitter (Je à UNI coleLboNI في‎ *8١ وزيادة بنسبة‎ - 

- وزيادة بنسبة /“ في التفاعل على Instagram‏ 

أسئلة للمناقشة: 

-١‏ كيف يمكن استخدام تحليلات وسائل التواصل الاجتماعي في صناعة المنتجات 
الاستهلاكية؟ 

۲- ما هي في رأيك التحديات الرئيسة والحلول والنتائج المحتملة لتطبيق تحليلات 
وسائل التواصل الاجتماعي على المنتجات الاستهلاكية وشركات الخدمات؟ 


Source: SproutSocial Case Study, "Titos Vodka Establishes Brand insights/case- 
studies/titos/(accessed July 2016). 


وبمرور الأعوام. تم تطوير مقاييس (أو قياسات) مختلفة لتحليل هياكل الشبكات الاجتماعية 
من وجهات نظر مختلفة. وغالبًا ما يتم تجميع هذه المقاييس ضمن ثلاث فتات: الروابط 
والتوزيعات والتقسيم إلى قطاعات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 





الفصل الخامس 


الروابط: 

حب الأشياء المتشابهة: وهو مدى قيام الجهات الفاعلة بتشكيل روابط مع آخرين بينهم 
تشابه مع غيرهم ممن يختلفون عنهم. ويمكن تعريف التشابه حسب الجنس أو النسب أو 
العمر أو المهنة أو التحصيل العلمي أو الحالة أو القيم أو أي سمة بارزة أخرى. 

التعدد: وهو عدد من نماذج المحتوى المضمنة في رابطء مثل: شخصين من الناس: وهما صديقان» 
بالإضافة إلى أنهما يعملان معًا مجموعة متعددة من اثنين. يرتبط التعدد بقوة العلاقة. 

تبادل العواطف / المعاملة بالمثل: هو مدى قيام اثنين من الممثلين بتبادل علاقات الصداقة أو 
غيرها من التفاعلات بين كل منهما. 

إغلاق الشبكة: وهو مقياس لإكمال العلاقات الثلاثيةء حيث إن افتراض الفرد لإغلاق الشبكة 
(أي أن أصدقاء أصدقائه هم أصدقاؤه أيضًا) Transitivity gail yaw‏ والتعدي هو نتيجة 
للخاصية الفردية أو الظرفية للحاجة إلى الإغلاق الإدراي. 

التجاور: وهو الميل للحصول على مزيد من الروابط مع الآخرين ذوي الموقع الجغرافي المقرب. 
التوزيعات: 

الجسر: وهو الشخص الذي يلأ فجوة هيكلية عن طريق روابطه الضعيفة» وهو الذي يوفر 
الرابط الوحيد بين فردين أو مجموعة. كما يتضمن أيضًا أقصر الطرق عندما يكون المدى الأطول 
غير ممكن بسبب وجود خطر كبير لتشويه الرسائل أو فشل التسليم. 

ا مركزية: وتشير إلى مجموعة من المقاييس التي تهدف إلى تحديد أهمية أو تأثير (في مجموعة 
متنوعة من الحواس) عقدة معينة (أو مجموعة) داخل الشبكة. ويوجد عدة طرق لقياس 
المركزية من أشهرها المركزية البينية» ومركزية التقارب» ومركزية القيمة الذاتية» ومركزية ألفاء 
بالإضافة إلى مركزية الدرجة. 

الكثافة: وهي نسبة الروابط المباشرة في الشبكة بالنسبة إلى العدد الإجمالي الممكن. 

المسافة: وهي الحد الأدنى لعدد الروابط المطلوبة لربط جهتين محددتين. 

الثقوب الهيكلية: وهي غياب الروابط بين جزئين من الشبكة. حيث إن العثور على ثقب 
هيكلي واستغلاله من الممكن أن يؤدي إلى منح صاحب المشروع ميزة تنافسية. وقد تم تطوير 
هذا المفهوم من قبل عاط الاجتماع غ:ناظ 100214 ويشار إليه أحيانًا على أنه مفهوم بديل لرأس 
JUI‏ الاجتماعي. 


In‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


قوة الربط: وتعرف بأنها مزيج خطي من الوقت» والكثافة العاطفيةء والحميمية» والمعاملة 
با مل (أي التبادلية). وتترابط العلاقات القوية بكل من حب الأشياء ال متش ابهةء والتجاورء 
والتعدي» في حين تترابط العلاقات الضعيفة مع الجسور. 


التقسيم إلى قطاعات: 

3I‏ , والدوائر الاجتماعية: ويتم تعريف المجموعات عاى أنها زمر إذا كان كل فرد مرتبطًا 
بشكل مباشر بجميع الدوائر الفردية أو الاجتماعية الأخرى مع مستوى صرامة أقل من الاتصال 
المباشرء وهذا تعريف غير دقيق» أو تعرف على أنها مجموعات متماسكة هيكليًا في حالة الرغبة 
في مستوى دقة أكبر. 

معامل التجميع (174ع00617) 01115]65128): وهو مقياس لاحتمال كون عضوين من العقدة 
مرتبطين. ويشير معامل التجميع الأعلى إلى درجة أكبر من الطائفية. 

التماسك: وهو مدى ارتباط الممثلين مباشرة ببعضهم البعض عن طريق روابط متماسكة. 
ويشير التماسك الهيكلي إلى الحد الأدنى لعدد الأعضاء الذين إذا تمت إزالتهم من مجموعة ما فإن 
ذلك من شأنه أن يؤدي إلى فك المجموعة. 


تحليلات وسائل التواصل الاجتماعي: 

تشير وسائل التواصل الاجتماعي إلى التقنيات المواتية للتفاعلات الاجتماعية بين الأشخاص 
الذين يقومون بإنشاء ومشاركة وتبادل المعلومات والأفكار والآراء في المجتمعات والشبكات 
الافتراضية: وهي عبارة عن مجموعة من تطبيقات البرامج المستندة إلى الإنترنت والتي تعتمد 
على الأمس الأيديولوجية والتقنية للويب 7,١‏ والتي تسمح بإنشاء وتبادل المحتوى الذي ينشئه 
Haenlein, 2010) ea2x ll‏ & anاKap).‏ وتعتمد وسائل التواصل الاجتماعي على تقنيات 
المحمول وغيرها من التقنيات القائمة على الويب لإنشاء منصات تفاعلية بشكل قوي للأفراد 
وا مجتمعات لمشاركة ال محتوى الذي ينشئه المستخدم وإنشاء المحتوى ومناقشته وتعديله. كما 
أنها تقدم تغييرات كبيرة في التواصل بين المنظمات واممجتمعات والأفراد. 

ومنذ ظهورها في أوائل التسعينيات شهدت تقنيات الشبكات الاجتماعية القائمة على الويب 
تحستًا (à «S‏ كل من الجودة والكمية. وتتخذ هذه التقنيات العديد من الأشكل المختلفة 
مما في ذلك المجلات عبر الإنترنت» ومنتديات الإنترنت» وسجلات الويبء والمدونات الاجتماعية, 
والمدونات الصغيرةء والويكي» والشبكات الاجتماعية. والحلقات الصوتية podcasts‏ والصور. 
والفيديوء وتقييمات / تصنيفات المنتجات / الخدمات. ومن خلال تطبيق مجموعة من النظريات 
ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ovo‏ 


الفصل الخامس 


في مجال أبحاث وسائل التواصل (الحضور الاجتماعيء ثراء وسائل التواصل) والعمليات الاجتماعية 

(التقديم الذاقء والإفصاح الذاق)» ess (2010) Haenleing Kaplan 5 J5 Lol‏ تصنيف 

لوسائل التواصل الاجتماعي بست أنواع مختلفة منها : )١(‏ المشاريع التعاونية (مثل ويكيبيديا» 

(؟) مدونات والمدونات الصغيرة (مثل تويتر). (؟) مجتمعات المحتوى (مثل: يوتيوب). )£( 

مواقع الشبكات الاجتماعية (مثل (Facebook‏ (0) عام الألعاب الافتراضية (مثل: 04 7870114 

else (C) «(Warcraft‏ اجتماعية افتراضية (مثل: عك]ذآ 20مء56). 

وتختلف وسائل التواصل الاجتماعي القائمة على الويب عن وسائل التواصل التقليدية / الصناعية, 

مثل الجرائد, والتلفازء والأفلام» حيث إنها رخيصة نسبيًا ويمكن الوصول إليها لتمكين أي شخص 

(حتى الأفراد العاديين) من نشر أو الوصول إلى / استهلاك المعلومات. وتتطلب وسائل التواصل 

الصناعية عمومًا موارد مهمة لنشر المعلومات» حيث إن المقالات (أو الكتب) تمر في معظم 

الحالات بالعديد من التنقيحات قبل نشرها. وفيما يلي بعض الخصائص الأكثر انتشارًا التي تساعد 

على التمييز بين وسائل التواصل الاجتماعي والصناعي (2010 (Morgan, Jones, & Hodges,‏ 

- الجودة: ففي مجال النشر الصناعي - بواسطة ناشر - فإن النطاق النموذجي للجودة يكون 
أضيق بشكل جوهري من الأسواق المتخصصة غير المغطاة. ويتمثل التحدي الرئيس الذي هثله 
ا محتوى في مواقع الشبكات الاجتماعية في حقيقة أن توزيع الجودة له تباين كبير: من عناصر 
عالية الجودة إلى محتوى منخفض الجودة: وأحيانًا مُسيء. 

- الوصول: توفر كل من تقنيات وسائل التواصل الصناعى والاجتماعي نطاقًا واسعًا وقادرًا على 
الوصول إلى جمهور عالمي. ومع ذلك فعادةً ما تستخدم وسائل التواصل الصناعي إطارًا مركزيًا 
للتنظيم والإنتاج والنشر في حين أن وسائل التواصل الجتماعي بطبيعتها أكثر لامركزية وأقل 
تسلسلًا وتميرًا بنقاط متعددة للإنتاج والمنفعة. 

- التكرار: حيث إن تحديث وإعادة النشر على منصات وسائل التواصل الاجتماعي يُعد أسهل 
وأسرع وأرخصء وذلك بالمقارنة مع وسائل التواصل الصناعية وبالتالي فإنه يمارس بشكل أكثر 
45,55 مما يؤدي إلى الحصول على محتوى أعذب. 

- إمكانية الوصول: عادةً ما تكون وسائل الإنتاج الخاصة بوسائل التواصل الصناعية حكومية و / 
أو شركات (مملوكة ملكية خاصة) ومكلفة؛ في حين أن أدوات وسائل التواصل الاجتماعي متاحة 
للجمهور بشكل عام بتكلفة قليلة أو بدون تكلفة. 

- سهولة الاستخدام: يتطلب إنتاج وسائل التواصل الصناعية عادةً مهارات متخصصة وتدريب. 
وعلى العكس من ذلكء فإن معظم إنتاج وسائل التواصل الاجتماعي لا يتطلب سوى إعادة 


oM‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


تفسير متواضع للمهارات القائمة؛ ومن الناحية النظرية» فإن أي شخص لديه إمكانيةء يستطيع 
تشغيل وسائل إنتاج وسائل التواصل الاجتماعي. 

- فورية: قد يكون الفارق الزمني بين الاتصالات التي تنتجها وسائل التواصل الصناعية طويكا 
(أسابيع أو شهور أو حتى ylis (Olgi‏ بوسائل التواصل الاجتماعي (التي يمكن أن تكون 
قادرة عاق الاستجابة نضورة فورية فرت 

- قابلية التحديث: لأيمكن تغبير وسائل التواصل الصناعية مجرة إنشائها (مجره طباعة مقالة 
المجلة وتوزيعهاء ولا يمكن إجراء تغبيرات على نفس المقالة): في حين كن تغيير وسائل التواضل 
الاجتماعي على الفور تقريبًا من خلال التعليقات أو التحرير. 


كيف يستخدم الناس وسائل التواصل الاجتماعي؟ 

لا يقتصر نمو مواقع الشبكات الاجتماعية على عددها فحسب بل تنمو أيضًا درجة ارتباطها 
gól (2011) Bastones Brogan ga JS ps 459 SLIL‏ بحث تقسم المستخدمين حسب مدى 
نشاطهم في استخدام وسائل التواصل الاجتماعي والتطور المتتبع لهذه القطاعات من المستخدمين 
بمرور الوقت. وقد أدرجوا ستة مستويات مشاركة مختلفة (الشكل 0-0\(. 


الميدعون 








المنضمون 








المتفرجون 





مستوى إرتباط وسائل التواصل الإجتماعى 


i 


v 


شكل 10-5: تطور مشاركة مستخدم وسائل التواصل الاجتماعي 

ووفقًا لنتائج البحث» فقد كان مجتمع المستخدمين عبر الإنترنت يتحول بشكل متزايد باتجاه 
المشاركة هرمية الشكل. والتغير الملحوظ بشدة هو الحادث فيما بين غير النشطين» حيث تضم 
هذه الفئة 66* من مستخدمي الإنترنت. وبعد ذلك بعامينء قفز أكثر من نصف هؤلاء الخاملين 
إلى وسائل التواصل الاجتماعي بشكل أو بآخر. وقد أشار عده]85 إلى أن: ”الآن حوالي XAY‏ 
من مستخدمي الإنترنت البالغين ضمن واحدة من الفئات العلياء لقد وصلت وسائل التواصل 
الاجتماعي إلى حالة من التبنّي الجماعي“. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 




















الفصل الخامس 


وقال 835]026: ”تشير وسائل التواصل الاجتماعي إلى الطرق المنهجية والعلمية لاستهلاك 
الكمية الهائلة من المحتوى الذي أنشأته وسائل التواصل الاجتماعي على شبكة الإنترنت» والأدوات 
والتقنيات من أجل تحسين قدرة المؤسسة على المنافسة. وقد أصبحت تحليلات وسائل التواصل 
الاجتماعي قوة جديدة في المنظمات حول العالم بشكل سريعء مما يسمح لها بالوصول إلى 
امستهلكين وفهمهم كما م يحدث من قبل. وبالإضافة إلى ذلك» فقد أصبحت وسائل التواصل 
الاجتماعي في العديد من الشركات» أداة للإستراتيجيات المتكاملة للتسويق والاتصالات. 

يوفر النمو الهائل لوسائل التواصل الاجتماعي» من المدونات» «Facebooks‏ وتويتر 
إلى )مى ويوتيوب» وأدوات التحليلات التي تستفيد من هذه المصادر الغنية بالبيانات» 
للمنظمات فرصة الدخول في محادثات مع ملايين العملاء حول العام كل يوم. وهذه ال ميزة هي 
السبب في أن ما يقرب من ثلثي الشركات ال ٠٠٠١‏ التي شاركت في دراسة استقصائية حديثة - أجرتها 
هارفارد بيزنس ريفيو أناليتيكس (Harvard Business Review Analytic Services) 1413s‏ 
- قالوا إنهم إما ييستخدمون حاليًا قنوات وسائل التواصل الاجتماعي أو لديهم خطط وسائل 
التواصل الاجتماعي (Harvard Business Review, 2010) JG. eSI à‏ ولكن ما زال الكثيرون 
يقولون إن وسائل التواصل الاجتماعي هي تجربة» حيث يحاولون فهم كيفية الاستخدام الأمثل 
للقنوات المختلفة» وقياس فعاليتهاء ودمج وسائل التواصل الاجتماعي في إستراتيجيتهم. 


قياس تأثير وسائل التواصل الاجتماعي: 
بالنسبة للمؤسسات - سواء كانت صغيرة أو كبيرة - فهناك إحصاءات قيّمة مخفية داخل 
المحتوى الذي أنشأه المستخدم على مواقع التواصل الاجتماعي» ولكن كيف هكنك أن تبرزها 
من بين عشرات مواقع المراجعة وآلاف المدونات والملايين من مشاركات >01هاء832 وملايين 
التغريدات؟ وإذا أمكنك القيام بذلك» فكيف تقيس تأثير جهودك؟ وهذه الأسئلة يمكن معالجتها 
من خلال تمديد التحليلات لتقنيات وسائل التواصل الاجتماعي. وبمجرد أن تحدد هدفك من 
وسائل التواصل الاجتماعي (ما تريد تحقيقه)ء فإن هناك العديد من الأدوات لمساعدتك على 
الوصول إلى هذا الهدف» وهذه الأدوات التحليلية تقع عادةً في ثلاث فئات واسعة: 
- التحليلات الوصفية: تستخدم إحصائيات بسيطة لتحديد خصائص واتجاهات النشاط مثل 
عدد الممتابعين لديك» وعدد المراجعات التي تم إنشاؤها على )00 طءء۴4 والقنوات التي يتم 
استخدامها في أغلب الأحيان. 


014 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


- تحليل الشبكات الاجتماعية: تتبع الروابط بين الأصدقاء والمعجبين والمتابعين لتحديد روابط 
التأثير بالإضافة إلى أكبر مصادر التأثير. 
- التحليلات المتقدمة: تتضمن تحليلات تنبؤية وتحليلات النصوص التي تدرس المحتوى في 
المحادثات عبر الإنترنت لتحديد المواضيع والمشاعر والارتباطات التي لن يتم الكشف عنها من 
خلال المراقبة العرضية. 
وتستخدم الأدوات والحلول المتطورة لتحليلات وسائل التواصل الاجتماعي جميع فئات 
التحليلات الثلاث (أي: وصفية» تنبؤية وقائية) بطريقة تدريجية إلى حد ما. 


أفضل الممارسات في تحليلات وسائل التواصل الاجتماعي: 

باعتبارها أداة ناشئةء فإن تحليلات وسائل التواصل الاجتماعي تمارس من قبل الشركات بطريقة 
عشوائية بعض الشيء. ونظرًا لعدم وجود منهجيات راسخة: فإن الجميع يحاولون إنشاء منهجياتهم 
الخاصة عن طريق التجربة والخطأ. وفيما يلي بعض أفضل الممارسات التي تم اختبارها ميدانيًا لتحليلات 
وسائل التواصل الاجتماعي التي اقترحها كل من عمنة2 و0255 (2012). 

الاعتقاد بأن القياس نظام توجيه لا نظام تصويت: غالبًا ما تستخدم القياسات للعقاب 
أو المكافآت؛ ولا ينبغي أن تكون كذلكء بل يجب أن يكونوا على معرفة بالأدوات وا ممارسات 
الأكثر فاعليةء وما يجب إيقافه لأنه لا يعمل وما يجب فعله أكثر لأنه يعمل بشكل جيد. 
ونظام التحليلات الجيد ينبغي أن يخبرك أين تحتاج إلى التركيز. وربما يكون كل هذا التركيز على 
136001 غير مهم لأن ذلك ليس مكان جمهورك. حيث إنه من الممكن أن يكونوا جميعهم 
على تويتر أو العكس. $95 «Chavess Paine J‏ فإن تفضيل القناة لن يكون بالضرورة بديهيًاء 
يقول كل منهم: ”لقد عملنا للتو مع فندق لم يكن لديه أي نشاط تقريبًا Ass) Twitter Jie‏ 
تجارية واحدة غير أن لديه الكثير من أنشطة 1۷:٤١‏ لإحدى علاماتهم التجارية العالية“ وبدون 
أداة قياس دقيقةء فإنك لن تعرف. 

تتبع الشعور: يريد العملاء أن يأخذوا ما يسمعونه ويتعلمونه من المحادثات عبر الإنترنت 
ويعملون عليه. والمفتاح لذلك هو أن تكون دقيقًا في استخراج وجمييز نواياهم من خلال قياس 
مشاعرهم. وكما رأينا سابقًا في هذا الفصلء فإن الأدوات التحليلية النصية يمكنها تصنيف المحتوى 
عبر الإنترنت» وكشف المفاهيم ال مرتبطةء وكشف الشعور في محادثة ك ”إيجابي“ ”سلبي“ أو 
”محايد“» استنادًا إلى الكلمات التي يستخدمها الناس. ومن الناحية المثالية» فإنك سوف ترغب في 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oya‏ 


الفصل الخامس 


أن تكون قادرًا على تمييز المشاعر تجاه منتج معينء وخدمة معينة. ووحدة أعمال محددة. وكلما 
زادت دقة فهمك للهجة والإدراك الذي يعبر عنه الناس: أصبحت المعلومات أكثر قابلية للتنفيذ, 
لأنك تخفف من المخاوف بشأن التناقض المختلط. ولا يجب وضع علامة ”محايدة“ على العبارة 
ذات التناقض المختلطء مثل: ”فندق في موقع رائع ولكن الحمام ذو رائحة كريهة“ لأن لديك 
إيجابيات وسلبيات تقابل بعضها البعض. ولكي تكون قابلة للتطبيق» فإنه يجب التعامل مع هذه 
الأنواع من العبارات بشكل منفصل. فمثلا عندما نقول: ”كان الحمام كريه الرائحة“ هو شيء 
يمكن لأي شخص أن يلمسه بنفسه ويحسن حالته. كما يمكن تقسيم هذه المشاعر وتصنيفهاء 
وإلقاء نظرة على الاتجاهات بمرور الوقت. ورؤية اختلافات كبيرة في الطريقة التي يتحدث بها 
الناس بشكل إيجابي أو سلبي عنكء فضلًا عن مقارنة المشاعر حول علامتك التجارية ge‏ منافسيك. 

تحسين دقة النص بشكل مستمر: إن استخدام حزمة تحليل نصوص خاصة بمجال الصناعة سوف 
يؤدي إلى معرفة مفردات عملك بالفعل. وسيكون للنظام قواعد لغوية مبنية فيه» لكنه يتعلم مع مرور 
الوقت ويصبح أفضل وأفضل. وبقدر تمكنك من ضبط نموذج إحصائيء بقدر حصولك على المزيد من 
البيانات» أو معلمات شبكة أفضلء أو تقنيات جديدة لتقديم نتائج أفضل: فإنك ستفعل الشيء نفسه 
مع معالجة اللغات الطبيعية التي تدخل في تحليل المشاعر. فإذا قمت بإعداد القواعد. والتصنيفات» 
بالإضافة إلى التنظيم» ومعانى الكلمات. شاهد كيف تبدو النتائج ثم عُذْ وكررها مرة أخرى. 


النظر إلى تأثير تأرجح النتائج: يسعى الجميع للوصول إلى نتيجة رائعة على موقع رفيع المستوى, 
ولكن هذا ليس كل شيء. فهناك فرق بين النتيجة الرائعة التي تظهر وتختفي في مقابل نتيجة رائعة يتم 
التغريد بهاء وإعادة التغريد. والتقاطها من قبل المدونين المؤثرين. ويجب أن توضح لك التحليلات أي 
من الأنشطة المتعلقة بوسائل التواصل الاجتماعي تتحول إلى ”فيروسية“ وأي منها يسكن سريعًاء ولماذا. 

النظر إلى ما وراء العلامة التجارية: إن اهتمام الأشخاص بعلامتهم التجارية فقط يعد من أكبر الأخطاء 
التي يرتكبونها. وللنجاح في تحليل واستخدام وسائل التواصل الاجتماعي. فيجب عليك تفهم كل ما يثار 
من القضايا المحيطة بمنتجك أو خدمتك. وعادةً لا يهتم العملاء برسالة الشركة أو علامتها التجارية؛ فهم 
يهتمون بأنفسهم. لذلك؛ فإنه يجب الانتباه إلى ما يتحدثون عنه وأين يتحدثون بذلك ومع من. 

التعرف على معظم التأثيرات القوية: تعاني المؤسسات من صعوبة تحديد صاحب التأثير الأكبر 
على الرأي العام» وهذا يبين أن أهم المؤثرين ليسوا بالضرورة ممن يؤيدون علامتك التجارية على وجه 
التحديد؛ ولكنهم يكونون ضمن من يؤثرون على نطاق ا محادثة الدائرة حول موضوعك وينبغي تفهم 
ما إذا كانوا يعطون آراءً إيجابيةء أو يعبرون عن دعمهم» أو ببساطة يقدمون بملاحظات أو نقد. وذلك 
من خلال فهم طبيعة محادثاتهم» ومكان علامتي التجارية فيما يتعلق بالمنافسة في تلك المنطقة. 


oye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (۲): تحليلات النص والويب ووسائل التواصل الاجتماعي 


النظرة الثاقبة إلى دقة أدواتك التحليلية: حتى وقت قريب ل تكن الأدوات الآلية امعتمدة 
على الحاسب تتسم بدرجة الدقة التي يتمتع بها البشر في غربلة محتوى الإنترنت. وحتى الآن 
تختلف الدقة باختلاف الوسائل. فبالنسبة لمواقع مراجعة المنتجات ومواقع مراجعة الفنادق 
وتويتر» يمكن أن تصل إلى دقة تتراوح بين ۸٠‏ و10 وذلك نظرًا لأن السياق يكون محاصرًا بشكل 
أكبر. وعندما تبدأ بالنظر إلى المدونات ومنتديات المناقشة. حيث تكون المحادثة واسعة النطاق» 
يمكن للبرنامج أن يحقق دقة تصل إلى “١‏ (2012 ,055 :8 عهنه). وستزداد هذه الأرقام 
بمرور الوقت لأن أدوات التحليلات يتم ترقيتها باستمرار بقواعد جديدة وخوارزميات محسنة 
لتعكس التجربة الميدانية والمنتجات الجديدة وتغير ظروف السوق وأنماط الكلام الناشئة. 

دمج ذكاء وسائل التواصل الاجتماعي في التخطيط: بمجرد أن يكون لديك منظور كبير للصورة 
مع نظرة تفصيلية» يكون بإمكانك البدء في دمج هذه المعلومات في دورة التخطيط الخاصة بك. 
غير أن هذا كلام يصعب تنفيذه. وقد كشف استطلاع سريع للجمهور أن قليل من الناس الآن 
يقومون بدمج التعلم من المحادثات عبر الإنترنت في دورات التخطيط الخاصة بهم )& Paine‏ 
2 013765). وتعد إحدى طرق تحقيق ذلك هي إيجاد علاقات زمنية بين مقاييس وسائل 
التواصل الاجتماعي وأنشطة الأعمال الأخرى أو أحداث السوق. وعادةً ما يتم اللجوء إلى وسائل 
التواصل الاجتماعي إما بشكل أساسي أو بواسطة شيء تقوم به مؤسستك. وبالتاليء إذا لاحظت 
تصاعدًا في النشاط في أي نقطة من الزمنء فتكون بحاجة بلعرفة أسباب ذلك. 


أسئلة مراجعة على القسم :٠١-0‏ 

-١‏ ما المقصود بالتحليلات الاجتماعية؟ ولماذا تعتبر مهمة؟ 

-Y‏ ما هي الشبكة الاجتماعية؟ وما هي الحاجة لنظام الحسابات القومية؟ 

؟W6ا‎ 2.0 ما هي وسائل التواصل الاجتماعي؟ وكيف ترتبط ب‎ -Y 

-٤‏ ما هي تحليلات وسائل التواصل الاجتماعي؟ وما هي أسباب تزايد انتشارها؟ 
0- كيف يمكنك قياس تأثير تحليلات وسائل التواصل الاجتماعي؟ 


تلخيص لأهم نقاط الفصل: 

- التنقيب في النص هو اكتشاف المعرفة من مصادر البيانات غير المهيكلة (غالبًا تستند إلى النص). 
وحيث إن قدرًا كبيرًا من المعلومات يكون في شكل نص فإن التنقيب في النص هو واحد من 
أسرع فروع مجال ذكاء الأعمال نموًا. 

ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري لفك 


الفصل الخامس 


- تتواجد تطبيقات التنقيب قي النص قي كل مجال من مجالات العمل والحكومة تقريبًاء ها في ذلك 
التسويق والتمويل والرعاية الصحية والطب والأمن الداخلي. 

- يقوم التنقيب في النص باستخدام معالجة اللغة الطبيعية (711.5) للحث على هيكلة مجموعة 
النصوصء ثم يستخدم بعد ذلك خوار زميات التنقيب في البيانات مثل التصنيف والتجميع 
والاقتران وتسلسل الاكتشاف لاستخراج المعرفة منها. 

- يمكن تعريف الشعور بأنه رأي ثابت يعكس مشاعر المرء. 

- يتعامل تحليل المشاعر مع التمييز بين فئتين؛ إيجابية وسلبية. 

- كمجال للبحث» يرتبط تحليل المشاعر ارتباطًا وثيقًا بعلم لغات الحاسوب والبرمجة اللغوية 
العصبية» والتنقيب في النصوص. 

- يحاول تحليل المشاعر الإجابة عن السؤال التالي: ”بم يشعر الناس حول موضوع معين؟“ عن 
طريق التعمق في آراء الكثيرين باستخدام مجموعة متنوعة من الأدوات الآلية. 

- يعتبر صوت العميل (VOC)‏ جزءًا لا يتجزأ من نظامّى إدارة علاقات العملاء التحليلية وإدارة 
تجارب العملاء» وغالبًا ما يتم تشغيلها من خلال تحليل المشاعر. 

- يدور صوت السوق (1021) حول فهم الآراء والاتجاهات الكلية على مستوى السوق. 

- يتم تحقيق تحديد التناقض في تحليل المشاعر إما باستخدام المعجم كمكتبة مرجعية أو باستخدام 
مجموعة من وثائق التدريب. 

WordNet -‏ هو معجم شهير للأغراض العامة تم إنشاؤه في جامعة برينستون. 

Senti WordNet -‏ هو امتداد ل ]1700716 لكي يُستخدم لتعريف المشاعر. 

- تحليلات الكلام هي مجال متزايد من العلوم يسمح للمستخدمين بتحليل واستخراج المعلومات 
من المحادثات الحيّة والمُسجلة. 

- يمكن تعريف التنقيب في الويب بأنه اكتشاف وتحليل معلومات مثيرة للاهتمام ومفيدة من 
الويب» وعن الويبء وعادةً ما تستخدم أدوات تستند إلى الويب. 

- يمكن النظر إلى التنقيب على الويب على أنه يتكون من ثلاثة مجالات هي: التنقيب في محتوى 
الويب والتنقيب في هيكل الويب. والتنقيب في استخدام i aag‏ 

- يشير التنقيب في محتوى الويب إلى الاستخراج التلقائي للمعلومات المفيدة من صفحات الويب» 
ويمكن استخدامه لتحسين نتائج البحث التي تنتجها محركات البحث. 


oyy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


- يشير التنقيب في هيكل الويب إلى توليد معلومات مثيرة للاهتمام من الروابط الموجودة ضمن 
صفحات الويب. 

- يمكن استخدام التنقيب في هيكل الويب أيضًّا لتحديد أعضاء مجتمع معينء وربمما أيضًا لأدوار 
الأعضاء في ا مجتمع. 

- يشير تعدين استخدام الويب إلى تطوير معلومات مفيدة من خلال تحليل سجلات خادم الويب» 
وملفات تعريف المستخدمينء ومعلومات المعاملات. 

- ظهر كل من التنقيب في النصوص والتنقيب في الويب كمكونات حيوية للجيل القادم من أدوات 
ذكاء الأعمال لتمكين المنظمات من التنافس بنجاح. 

- محرك البحث هو برنامج يقوم بالبحث عن الوثائق (مواقع الإنترنت أو الملفات)» استنادًا إلى 
الكلمات المفتاحية (كلمات فردية» أو مصطلحات متعددة الكلمات. أو جملة كاملة) التي 
يقدمها المستخدمونء والتي تتعلق بموضوع استعلاماتهم. 

- 580 هو النشاط ا معني بالتأثير على رؤية أي موقع تجارة إلكترونية أو أي موقع ويب في نتائج 
البحث الطبيعية لمحرك البحث (غير المدفوع أو الأساسي). 

- 700 هو مصطلح يستخدم عادةً لوصف العملية التحليلية لالتقاط توقعات العميل وتفضيلاته 
وعدم تفضيلاته. 

- التحليلات الاجتماعية هي مراقبة وتحليل وتفسور التفاعلات الرقمية وعلاقات الأشخاص 
وا مواضيع والأفكار وا محتوى. 

- الشبكة الاجتماعية هى بنية اجتماعية تتألف من أفراد / أشخاص (أو مجموعات من الأفراد أو 
المنظمات) ترتبط فيما بيتها بنوع من الروابظ / العلاقات. 

- تشير تحليلات وسائل التواصل الاجتماعي إلى الطرق المنهجية والعلمية لاستهلاك الكمية الهائلة 
من المحتوى الذي تم إنشاؤه بواسطة منافذ وأدوات وتقنيات وسائل التواصل الاجتماعي على 
الويب من أجل تحسين القدرة التنافسية للمنظمات. 


مصطلحات أساسية: 


اقتران. معالجة اللغة الطبيعية تحليلات وسائل التواصل البيانات غير 
.(NLP)‏ الاجتماعي. المهيكلة. 

صفحات وضع علامات على جزء من شبكة اجتماعية. صوت العميل 

موثوقة. الكلام. (VOC)‏ 

















ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ovr‏ 











الفصل الخامس 


تحليل النقر. 


جسم 
كشف الخداع. 


البحث عن 
موضوع ناجم 
رابط تشعبي 

HITS) 








أسئلة للمناقشة: 


تحديد التناقض. 


.Polyseme 


محرك البحث. 


تحليل المشاعر. 


.Senti WordNet 


المحاور. | تحليل القيمة المفردة (5۷9). 





عنكبوت. 
الانبثاق. 
كلمات التوقف. 

فوفة 
Term-Document‏ 


.(TDM) 
التنقيب في النص.‎ 


-Tokenizing 


تحليل النزعة. 





تحليلات الويب. 
التنقيب في محتوى 
الويب 


زاحف الويب. 


التنقيب في الويب. 


الويب. 
التنقيب باستخدام 
الويب. 
-WordNet‏ 





-١‏ اشرح العلاقة بين التنقيب في البيانات» والتنقيب في النص؛ وتحليل المشاعر. 

-Y‏ عرف - بأسلوبك الخاص - التنقيب في النص» وناقش تطبيقاته الأكثر شيوعًا. 

-٠‏ ماذا يعني الحث على هيكلة البيانات النصية؟ ناقش الطرق البديلة لهيكلة البيانات النصية. 

-٤‏ ما هو دور N1۴‏ ف التنقيب في النص؟ ناقش قدرات وقيود N1۴‏ في سياق التنقيب في النص. 

0- اسرد وناقش ثلاثة مجالات تطبيق بارزة للتنقيب في النص. ما هي الفكرة الرئيسة الشائعة بين 
مجالات التطبيق الثلاثة التي اخترتها؟ 

1- ما هو تحليل المشاعر؟ وكيف يرتبط بالتنقيب في النص؟ 

۷- ما هي التحديات الشائعة التي يتعين على تحليل المشاعر التعامل معها؟ 

۸- ما هي مجالات التطبيق الأكثر شيوعًا لتحليل المشاعر؟ ولاذا؟ 


ovt 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


























التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


٩‏ ما هي الخطوات الرئيسة في تنفيذ مشروعات تحليل المشاعر؟ 

-٠١‏ ما هما الطريقتان الشائعتان لتحديد التناقض؟ اشرح إجابتك. 

-١‏ ناقش أوجه الاختلاف والشبه بين التنقيب في النص والتنقيب في الويب. 

-١١‏ بأسلوبك الخاص عرف التنقيب ف الويب» مع مناقشة أهميته. 

-١‏ ما هي المجالات الرئيسة الثلاثة للتنقيب في الويب؟ ناقش أوجه الاختلاف والشبه بين هذه 
المجالات الثلاثة. 

-٤‏ ما هو محرك البحث؟ وماذا يعتبر مهما للشركات؟ 

SEO 5a ls -1O‏ ومن الذي يستفيد منه؟ وكيف؟ 

las asl Cod qa a - MY‏ للقائيس للستخدمة فيا 

۷- عرف كلا من التحليلات الاجتماعية والشبكة الاجتماعية وتحليلات الشبكة الاجتماعية. وما 
هي العلاقات فيما بينها؟ 

- ما هي تحليلات وسائل التواصل الاجتماعي؟ وكيف تتم؟ ومن الذي يقوم بها؟ وماذا يخرج منها؟ 


تمارين - شبكة جامعة تيراداتا (11771) وغيرها من التمارين اليدوية: 

-١‏ قم بزیارة .teradatauniversitynetwork.c0m‏ حدد الحالات عن التنقيب في النص. قم 
بوصف التطورات الأخيرة في هذا المجال. إذا لم تستطع إيجاد حالات كافية على موقع شبكة 
جامعة تيراداتا على الويب» قم بتوسيع بحثك إلى موارد أخرى تستند إلى الويب. 

-١‏ انتقل إلى teradatauniversitynetwork.com‏ أو حدد مكان الأوراق البيضاء والندوات على 
الويب والواد الأخرى المتعلقة بالتنقيب في النصوص. قم بتجميع النتائج الخاصة بك في 
تقرير قصير مكتوب. 

3loob e35 teradatauniversitynetwork.com |J] «1231 -Y‏ دراسة الحالة التي تحمل اسم 
dJbJI 1,3! "eBay Analytics"‏ بعنايةء وافهمها جيدًا من خلال البحث في الإنترنت للحصول 
على معلومات إضافية» والإجابة عن أسئلة الحالة. 

ع- انتقل إلى iteradatauniversitynetwork.com‏ وابحث عن حالة تحليل المشاعر التي تحمل 

اسم *How Do We Fix an App Like That?"‏ !13 الوصف» واتبع الإرشادات لتنزيل 
بيانات وأداة تنفيذ التمرين. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ovo‏ 


الفصل الخامس 


-٥‏ قم بزيارة .teradatauniversitynetwork.com‏ حدد الحالات عن التنقيب في الويب. قم 
بوصف التطورات الأخيرة في هذا ا مجال. إذا م تستطع إيجاد حالات كافية على موقع شبكة 
جامعة تيراداتا على الويب» قم بتوسيع بحثك إلى موارد أخرى تستند إلى الويب. 

- تصفح الويب وقواعد البيانات الرقمية الخاصة بمكتبتك لتحديد المقالات التي تصنع الرابط بين 
التنقيب في النصوص / الويب والأنظمة المعاصرة لذكاء الأعمال. 


مشروعات مهام الفريق ولعب الأدوار: 

-١‏ افحص كيفية التقاط البيانات النصية تلقائيًا باستخدام تقنيات الويب. وفور التقاطهاء ما هي 
الأنماط المحتملة التي يمكنك استخراجها من هذه المصادر غير المهيكلة للبيانات؟ 

1- قم بمقابلة المسؤولين في كليتك أو المسؤولين التنفيذيين في مؤسستك لتحديد كيف يمكن أن 
يساعدهم التنقيب في النصوص والتنقيب في الويب في عملهم. اكتب اقتراحًا يصف نتائجك» 
ثم أعدَّ تقريرًا يتضمن تقديرات التكلفة والفوائد. 

-Y‏ انتقل إلى موارد مكتبتك على الإنترنت. تعلم كيفية تنزيل سمات مجموعة من الأدبيات 
(مقالات الدوريات) في موضوع محدد. ثم قم بتنزيل البيانات ومعالجتها باستخدام منهجية 
مشابهة لتلك التي تم شرحها في الحالة العملية .)0-٥(‏ 

ع- ابحث عن مجموعة بيانات نص المشاعر المتاحة بسهولة (انظر الرؤية الفنية (0-؟)للحصول على 
قائمة بمجموعات البيانات الشائعة) وقم بتنزيلها إلى جهاز الحاسب الخاص بك. إن كان لديك 
أداة تحليلية قادرة على التنقيب في النصوصء فاستخدمها. وإن لم يكن قم بتنزيل وتثبيت 
e3 .RapidMiner (http://rapid-i.com)‏ أيضًا بتثبيت الوظيفة الإضافية Text Analytics‏ 
لبرنامج 103/11565م82. قم بمعالجة البيانات التي تم تنزيلها باستخدام أداة التنقيب في النص 
(أي تحويل البيانات إلى نموذج منظم)» ثم قم ببناء النماذج وتقييم دقة الكشف عن المشاعر 
في العديد من نماذج التصنيف (مثل: آلة المتجهات الداعمةء أشجار القرارء الشبكات العصبيةء 
الانحدار اللوجستي). اكتب تقريرًا تفصيليًا تشرح فيه نتائجك وخبراتك. 

5- افحص كيفية التقاط البيانات المستندة إلى الويب تلقائيًا باستخدام أحدث التقنيات. وفور 

التقاطهاء ما هي الأنماط المحتملة التي يمكنك استخراجها من هذه المصادر الغنية بالمحتوى 
للبيانات» والتي تكون في معظمها غير منظمة؟ 


0 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


تمارين الإنترنت: 

-١‏ قم بإيجاد حالات حديثة لتطبيقات ناجحة عن التنقيب في النصوص والتنقيب في الويب. 
جرب موردي وشركات الاستشارات لبرامج التنقيب في النصوص والويب وابحث عن حالات أو 
قصص نجاح» ثم قم بإعداد تقرير يلخص خمس دراسات حالة جديدة. 

2l -Y‏ إلى «Downloads 521 .statsoft.com‏ وقم بتنزيل ثلاث صفحات بيضاء على الأقل 
حول التطبيقات. أي من هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / 
الويب التي تمت مناقشتها في هذا الفصل؟ 

-٠‏ انتقل إلى 585.602 وقم بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي من 
هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشتها 
في هذا الفصل؟ : 

ع- انتقل إلى 152.02 وقم بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي من 
هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشتها 
في هذا الفصل؟ 5 

«teradata.com (I J 3l -o‏ وقم بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي 
من هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشتها 
في هذا الفصل؟ i‏ 

-٦‏ انتقل إلى (Ji y» e35 «clarabridge.com‏ ثلاث صفحات بيضاء على الأقل حول التطبيقات. 
أي من هذه التطبيقات استخدم تقنيات التنقيب في النص بطريقة مبتكرة؟ 

|J] Jàsl -V‏ 5.60122] 10101188 قم باستكشاف الأقسام حول التطبيقات وكذلك البرامج. قم 
بإيجاد أسماء ثلاث حزم إضافية على الأقل للتنقيب في البيانات والتنقيب في النصوص. 

8- قم مسح بعض أدوات وموردي التنقيب في الويب. حدد بعض منتجات التنقيب في الويب 
ومقدمي الخدمات غير المذكورة في هذا الفصل. 

-٩‏ انتقل إلى JL jiis ëg attensity.com‏ ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي 
من هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشتها 
في هذا الفصل؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ovv‏ 


الفصل الخامس 


المراجع: 

- Bond C. F, & DePaulo, B. M. (2006). Accuracy of deception judgments. Personality and Social 
Psychology Reports, 10(3), 214-234. 

- Brogan, C., & Bastone, J. (2011). Acting on customer intelligence from social media: The new edge 
for building cus- tomer loyalty and your brand. SAS white paper. 

- Chun, H. W., Tsuruoka, Y., Kim, J. D., Shiba, R., Nagata, N., & Hishiki, T. (2006). Extraction of gene- 
disease relations from MEDLINE using domain dictionaries and machine learning. Proceedings of 
the 11th Pacific Symposium on Biocomputing, 4-15. 

- Coussement, K, & Van Den Poel, D. (2008). Improving customer complaint management 
by automatic email classification using linguistic style features as predictors. Decision Support 
Systems, 44(4), 870-882. 

- Coussement, K., & Van Den Poel, D. (2009). Improving customer attrition prediction by integrating 
emotions from client/company interaction emails and evaluating multiple classifiers. Expert 
Systems with Applications, 36(3), 6127-6134. 

- Cutts, M. (2006, February 4). Ramping Up on International Webspam. mattcutts.com/blog. 
mattcutts.com/blog/ramp ing-up-on international-webspam (accessed March 2013). Delen, D., & 
Crossland, M. (2008). Seeding the survey and analysis of research literature with text mining. 
Expert Systems with Applications, 34(3), 1707-1720. 

- Esuli, A., & Sebastiani, E. (2006, May). SentiWordNet: A publicly available lexical resource for 
opinion mining. In Proceedings of LREC, 6, 417-422. 

- Etzioni, O. (1996). The World Wide Web: Quagmire or gold mine? Communications of the ACM, 
39(11), 65-68. 

- EUROPOL. (2007). EUROPOL Work Program 2005. statewatch. org/news/2006/apr/europol- 
work-programme-2005.pdf (accessed October 2008). 

- Feldman, R., & Sanger, J. (2007). The text mining handbook: Advanced approaches in analyzing 
unstructured data. Boston: ABS Ventures. 

- Fuller, C. M., Biros, D., & Delen, D. (2008). Exploration of feature selection and advanced 
classification models for high-stakes deception detection. Proceedings of the 41st Annual Hawaii 
International Conference on System Sciences (HICSS), Big Island, HI: IEEE Press, 80-99. 

- Ghani, R., Probst, K., Liu, Y., Krema, M., & Fano, A. (2006). Text mining for product attribute 
extraction. SIGKDD Explorations, 8(1), 41-48. 

- Goodman, A. (2005). Search engine showdown: Black hats versus white hats at SES. 
SearchEngineWatch. searchenginewatch.com/article/2066090/Search-Engine-Showdown-Black- 
Hats-vs.-White-Hats-at-SES (accessed February 2013). 


OYA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (۲): تحليلات النص والويب ووسائل التواصل الاجتماعي 


- Han, J., & Kamber, M. (2006). Data mining: Concepts and techniques, 2nd ed. San Francisco: 
Morgan Kaufmann. 

- Harvard Business Review. (2010). The new conversation: Taking social media from talk to action. 
A SAS-Sponsored Research Report by Harvard Business Review Analytic Services. sas.com/ 
resources/whitepaper/wp 23348.pdf (accessed March 2013). 

- Kaplan, A. M., & Haenlein, M. (2010). Users of the world, unite! The challenges and opportunities 
of social media. Business Horizons, 53(1), 59-68. 

- Kim, S. M., & Hovy, E. (2004, August). Determining the sentiment of opinions. In Proceedings of the 20th 
International Conference on Computational Linguistics (p. 1367). Association for Computational Linguistics. 

- Kleinberg, J. (1999). Authoritative sources in a hyperlinked environment. Journal of the ACM, 
46(5), 604-632. 

- Lin, J, & Demner-Fushman, D. (2005). *Bag of words" is not enough for strength of evidence 
classification. AMIA Annual Symposium Proceedings, 1031-1032. pubmedcentral.nih.gov/ 
articlerender.fcgi?artid- 1560897. 

- Liu, B., Hu, M., & Cheng, J. (2005, May). Opinion observer: Analyzing and comparing opinions on the 
Web. In Proceedings of the 14th International Conference on World Wide Web (pp. 342-351). ACM. 

- Mahgoub, H., Rósner, D., Ismail, N., & Torkey, F. (2008). A text mining technique using association 
rules extraction. International Journal of Computational Intelligence, 4(1), 21-28. 

- Manning, C. D., & Schutze, H. (1999). Foundations of statistical natural language processing. 
Cambridge, MA: MIT Press. 

- McKnight, W. (2005, January 1). Text data mining in business intelligence. Information Management 
Magazine. informationmanagement.com/issues/20050101/10164871.html (accessed May 22, 2009). 

- Mejova, Y. (2009). Sentiment analysis: An overview. Comprehensive exam paper. http://www. 
cs.uiowa.edu/-ymejova/publications/CompsYelenaMejova.pdf (accessed February 2013). 

- Miller, T. W. (2005). Data and text mining: A business applications approach. Upper Saddle River, 
NJ: Prentice Hall. 

- Morgan, N., Jones, G., & Hodges, A. (2010) The complete guide to social media from 
the social media guys. thesocialmediaguys.co.uk/wpcontent/uploads/downloads/2011/03/ 
CompleteGuidetoSocialMedia.pdf (accessed February 2013). 

- Nakov, P., Schwartz, A., Wolf, B., & Hearst, M. A. (2005). Supporting annotation layers for natural 
language processing. Proceedings of the ACL, Interactive Poster and Demonstration Sessions, Ann 
Arbor, MI. Association for Computational Linguistics, 65-68. 

- Paine, K. D., & Chaves, M. (2012). Social media metrics. SAS white paper. sas.com/resources/ 
whitepaper/wp 19861. pdf (accessed February 2013). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ova‏ 


الفصل الخامس 


- Pang, B., & Lee, L. (2008). Opinion mining and sentiment analysis. Hanover, MA: Now Publishers, 
available at http://books.google.com. 

- Ramage, D., Hall, D., Nallapati, R., & Manning, C. D. (2009, August). Labeled LDA: A supervised 
topic model for credit attribution in multi-labeled corpora. In Proceedings of the 2009 Conference 
on Empirical Methods in Natural Language Processing: Volume 1 (pp. 248-256). Association for 
Computational Linguistics. 

- Schmidt, L.-H. (1996). Commonness across cultures. In A. N. Balslev (Ed.), Cross-cultural 
conversation: Initiation (pp. 119-132). New York: Oxford University Press. 

- Scott, W. R., &. Davis, G. E. (2003). Networks in and around organizations. In Organizations and 
Organizing. Upper Saddle River: NJ: Pearson Prentice Hall. 

- Shatkay, H., Hóglund, A., Brady, S., Blum, T., Dónnes, P., & Kohlbacher, O. (2007). SherLoc: High- 
accuracy prediction of protein subcellular localization by integrating text and protein sequence 
data. Bioinformatics, 23(11), 1410-1415. 

- Snyder, B., & Barzilay, R. (2007, April). Multiple aspect ranking using the good grief algorithm. In 
HLT-NAACL (pp. 300-307). 

- Strapparava, C., & Valitutti, A. (2004, May). WordNet affect: An affective extension of WordNet. In 
LREC (Vol. 4, pp. 1083-1086). 

- The Westover Group. (2013). 20 key Web analytics metrics and how to use them. http://www. 
thewestovergroup.com (accessed February 2013). 

- Thomas, M., Pang, B., & Lee, L. (2006, July). Get out the vote: Determining support or opposition 
from Congressional floor-debate transcripts. In Proceedings of the 2006 Conference on Empirical 
Methods in Natural Language Processing (pp. 327-335). Association for Computational Linguistics. 

- Weng, S. S., & Liu, C. K. (2004). Using text classification and multiple concepts to answer e-mails. 
Expert Systems with Applications, 26(4), 529-543. 


or.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل السادس 
التحليلات التوجيهية: التحسين والمحاكاة 


أهداف التعلم: 
- فهم تطبيقات تقنيات التحليلات التوجيهية بالاشتراك مع إعداد التقارير والتحليلات التنبؤية. 
- استيعاب المفاهيم الأساسية لنمذجة القرارات التحليلية. 
- استيعاب مفاهيم النماذج التحليلية لمشاكل القرار المختارة» بما في ذلك البرمجة الخطية ونماذج 
المحاكاة لدعم القرار. 
- وصف كيفية استخدام جداول البيانات بالنسبة لكل من النمذجة التحليلية والحلول التحليلية. 
- شرح المفاهيم الأساسية للتحسين وتوقيت استخدامها. 
- وصف كيفية هيكلة نموذج برمجة خطية. 
- شرح المقصود بتحليل الحساسية» وتحليل «ماذا - لو» والبحث عن الهدف. 
- استيعاب مفاهيم وتطبيقات أنواع ا محاكاة ا مختلفة. 
- فهم التطبيقات ال محتملة ممحاكاة الأحداث المنفصلة. 
يعد هذا الفصل إضافة جديدة إلى هذا الكتاب» حيث يتخطى مرحلة تطبيقات التحليلات وصولًا 
إلى ما بعد إعداد التقارير والتحليلات التنبؤية. ويغطي هذا الفصل التقنيات المختارة التي يمكن 
توظيقها جنبًا إلى جنب مع النماذج التنبؤية للمساعدة في دعم القرار. ونركز هنا على التقنيات 
التي يسهل تنفيذها نسبيًّا سواء باستخدام أدوات جداول البيانات أو باستخدام أدوات برمجية قائمة 
بذاتها. وبالطبع» يوجد الكثير من التفاصيل الإضافية ليتم تعلمها حول نماذج علوم الإدارةء ولكن 
الهدف من هذا الفصل هو فقط توضيح ما هو ممكن وكيفية تنفيذه ضمن إعدادات حقيقية. 
ونعرض فيما يلي تقديًا لهذه المادة مع ملاحظة الحذر: قد تشكل النمذجة موضوعًا صعبًاء 
كما تعد فنا بجانب كونها علمًا. وليس بالضرورة أن تكون الغاية من هذا الفصل أن تصبح خبيرا 
با موضوعات التي تتعلق بالنمذجة والتحليل» ولكن تُستخدّم المادة لاكتساب المعرفة بالمفاهيم 
المهمة من حيث صلتها بالتحليلات التوجيهية واستخدامها في صنع القرار. ومن المهم أن ندرك أن 
النمذجة التي نحن بصدد الحديث عنها هنا ترتبط فقط بشكل سريع بمفاهيم نمذجة البيانات» 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oft‏ 


الفصل السادس 


فيجب عدم الخلط بينهما. إننا نتحرك عبر بعض المفاهيم والتعاريف الرئيسة لنمذجة القرارء ونقدم 
بعد ذلك فكرة النمذجة بشكل مباشر في جداول البيانات» ثم بعد ذلك نناقش الهيكل والتطبيق 
لنماذج ومنهجيات برهنت على نجاحها عبر الزمن: البرمجة الخطية ومحاكاة الحدث المنفصل. 
وكما ذُكِرَ سابقّه من الممكن الحصول على دورات متعددة - تحديدًا - في هذين الموضوعين» ولكن 
هدفنا هو منحك إحساس بما هو ممكنء وذلك من خلال الأقسام المتنوعة لهذا الفصل. 

١-5‏ مقال افتتاحي: منطقة فيلاديلفيا التعليمية تستخدم التحليلات التوجيهية 
لإيجاد حل أمثل لإبرام عقود خطوط سير الحافلات: 


aai 


يعد اختيار أفضل الموردين للعمل مهمة مرهقة بل وذات أهمية كبيرة للشركات والمنظمات 
الحكومية. فبعد تقديم كل مورد لعطائه بخصوص مهمة معينة من خلال عملية ال مناقصةء تقوم 
الشركة أو المنظمة بتقييم كل اقتراح ومن ثم اتخاذ قرار بشأن اختيار المورد الأنسب لاحتياجاتهم. 
وعادةً. تضطر الحكومات لاستخدام عملية تقديم العطاءات للمفاضلة بين الموردين ومن ثم 
الاختيار من بينهم. كانت منطقة فيلاديلفيا التعليمية تسعى للاستعانة بمصادر خارجية لبعض 
خطوط الحافلات الخاصة بهم؛ إذ لا تمتلك المقاطعة إلا عددًا قليلًا من حافلات المدارسء لا يكفي 
لخدمة الطلاب القاطنين بهاء فكانوا يخدمون بحافلاتهم الخاصة من >١‏ إلى >٤١‏ فقط من 
الطرق» فقرروا الاستعانة موردي خدمة الحافلات الخاصة كمصدر خارجي لتغطية بقية الطرق. 
تم تكليف تشارلز لويتز 10W1٤2(‏ ءاه ط۳)» المنسق المالي لمكتب النقل: بتحديد كيفية تعظيم 
العائد على الاستثمار وتحسين طريقة إبرام العقود مع مختلف الموردين. 

في الماضيء كانت عملية اختيار موردي خدمة الحافلات الذين يتم التعاقد معهم وفقًا للقيود 
المالية والزمنية عملية مرهقة إذ كانت تتم يدويًا. بالإضافة إلى ذلكء كانت المتغيرات والعوامل 
المختلفة التي يجب مراعاتها تزيد الأمر تعقيدًا. فقد كانت عملية تقييم الموردين لهذه الخدمة 
تتم بناءَ على خمسة متغيرات وهي: التكلفة. والقدرات. والأمانة» والاستقرار المالي» والفراسة. 
قام كل مورد بتقديم عطاءه بسعر مختلف للطرق ال مختلفة. وضع بعض الموردين حدًا أدنى 
لعدد خطوط السير. وفي حالة عدم مقابلة هذا العدد للمطلوبء فستزيد التكلفة. وكان Lowitz‏ 
بحاجة معرفة كيفية دمج المعلومات لكل عطاء تم تقديمه. وذلك لتوزيع خطوط السير على 
الموردين بحيث تتم تغطية كل الطرق بأقل تكلفة. 


ovv‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


الحل: 

بحث 1.0171 في البداية عن برنامج يستطيع استخدامه جنبًا إلى جنب مع نموذج العقد 
الخاص 5 4 Frontline à. 5 5 4 Premium Solver e 45, elasc b 18 .Excel JL e‏ 
اور مما مكنه من تحديد أفضل الموردين ماليًا وتشغيليًاء وقام بإنشاء نموذج أمثل يأخذ 
في الحسبان المتغيرات الخمسة سالفة الذكر المتعلقة بكل مورد. وقد تضمن النموذج متغيرات 
ثنائية صحيحة (نعم / لا) لكل خط من خطوط السير ليتم منحها للموردين الذين تقدموا لتغطية 
خط سير معين بتكلفة معينة. وقد بلغت هذه المتغيرات ذات (نعم / لا) ما يقرب من ٠٠٠١‏ 
متغير. كما تضمن النموذج أيضًا قيودًا تشير إلى أنه سيتم تخصيص مورد واحد فقط لكل خط 
ue‏ وبالطبع لا بد من تغطية كل خطوط السير. وتم وضع حد أدنى لعدد خطوط السير التي 
يخدمها أي مورد كما تم وضع قيود لبعض التفاصيل الأخرى. ويمكن كتابة كل هذه القيود 
كمعادلات وإدخالها في نموذج برمجة خطية تامة. وتجدر الإشارة إلى أن هناك العديد من أدوات 
البرامج تستطيع صياغة مثل هذه النماذج وحلهاء غير أن استخدام اع©:*1 111505016 يجعل فهم 
النموذج أمرًا أكثر سهولة. فتم تضمين برنامج 501۷۵۲ الخاص بشركة ۶" ۵ار؟ ۸۵ ذا٤ ۴۲٥٣‏ داخل 
أدوات اء»:8 :1160505 للقيام بحل المشاكل الصغيرة مجانًا. أما النماذج الأكبر حجمًا والأكثر 
تعقيدًا فيمكن حلها عن طريق شراء إصدار أكبر. وهذا ما فعله .Lowitz‏ 


الفوائد: 

ساعد النموذج في تطوير حجم كل عقد من العقودء فضلًا عن تحديد عدد الموردين الواجب 
التعاقد معهم. حيث يتفاوت حجم العقود من مورد لآخر وذلك ما بين ٩۷-٤‏ خط سير للمورد 
الواحد. وفي النهاية» تمكنت منطقة فيلاديلفيا التعليمية من وضع خطة تحتوي على العدد الأمثل 
لشركات توريد الحافلات باستخدام برنامج 83681 بدلا من العملية اليدوية. وهكذا تمكنت 
المقاطعة من توفير الوقت والمال وذلك باستخدام الأدوات التحليلية لبرنامج Premium Solver‏ 
لإنشاء نموذج أمثل بالمتغيرات المختلفة. 


ماذا يمكننا أن نتعلم من هذه المقالة القصيرة: 
تواجه معظم المنظمات مشكلة صنع القرارات حين يلزم اختيار واحد من عدة خيارات. إذ 


يكون لكل خيار تكلفة وإمكانية يرتبطان به. وتهدف مثل هذه النماذج إلى اختيار توليفة من 
الخيارات تلبي جميع المتطلبات بجانب تدنية التكاليف. كما يجب ملاحظة أنه يتم تطبيق 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ofr‏ 


الفصل السادس 


التحليلات التوجيهية بشكل خاص على مثل هذه المشكلة المتعلقة بالقرارات. ووجود أدوات مثل 
61 262211113 المتاح داخل 835661 يجعل من السهولة بمكان تطبيق مثل هذه التقنيات. 


أسئلة مراجعة على المقالة الافتتاحية: 
-١‏ ما هو القرار المتخذ في هذه المقالة الإفتتاحية؟ 
ls -Y‏ هي البيانات (الوصفية أو التنبؤية) التي قد يتم الاحتياج إليها لعمل أفضل التوزيعات في هذا السيناريو؟ 
-٠‏ ما هي التكاليف أو القيود الأخرى الواجب مراعاتها عند إبرام مثل هذه العقود المتعلقة بخطوط السير؟ 
ع- ما هي المواقف الأخرى التي يمكن تطبيق مثل هذه النماذج عليها؟ 
5-5 اتخاذ القرار بناءً على النموذج: 

إن اتخاذ القرارات باستخدام أحد أنواع النموذج التحليلي هو ما نسميه التحليلات التوجيهية, 
وذلك كما تبين من المقالة القصيرة السابقة. وقد تعلمنا في العديد من الفصول السابقة قيمة 
وعملية معرفة تاريخ ما يجري واستخدام هذه ا معلومات أيصًا من أجل التنبؤ بالأمور ارجح 
حدوثها. وعلى أية حال» فإننا سنحاول من خلال هذا التمرين تحديد ما ينبغي alae‏ فيما هو 
آتِ. وقد يترتب على ذلك تحديد العملاء المُرجح قيامهم بالشراء منا وتقديم عرض أو إعطاء 
سعر يزيد من احتمالية قيامهم بالشراء» وبالتالي فإن ذلك سيؤدي إلى تعظيم الأرباح إلى الحد 
الأمثل. وعلى العكس من ذلكء فقد ينطوي الأمر على القدرة على التنبؤ بالعميل الذي يحتمل 
اتجاهه إلى مكان آخر والقيام بتقديم عرض مُغري له للاحتفاظ به كأحد العملاء ورفع قيمتنا 
لديه. وللتأكد من تغطية جميع احتياجاتنا وتقليل التكلفة إلى أدنى حد ممكن فإننا قد نحتاج إلى 
اتخاذ بعض القرارات بخصوص منح العقود للموردين. ومن الممكن أن نواجه وضعًا ما يتطلب 
تحديد أي العملاء المحتملين ينبغي حصوله على مواد الحملة الترويجية بحيث لا تكون تكاليف 
التروي ج التي نتحملها باهظةء ونقوم بزيادة معدل الاستجابة إلى أقصى حد ممكن ما لا يتعدى 
حدود الميزانية. وقد نتخذ قرارًا بشأن ما يجب دفعه مقابل كلمات البحث الرئيسة غير المجانية 
لرفع عائد الاستثمار لميزانية الإعلانات الخاصة بنا إلى أقصى حد ممكن. وعلى صعيد آخرء فإننا قد 
نضطر إلى دراسة تاريخ أنماط وصول عملائنا واستخدام تلك المعلومات من أجل التنبؤ بمعدلات 
الوصول المستقبلية» وتطبيق ذلك لجدولة عدد مناسب من موظفي المتجر لرفع استجابات العملاء 
إلى أقصى حد بالإضافة إلى تحسين تكاليف العمالة لدينا. ويمكننا من خلال الاعتماد على تحليلاتنا 


Source: Adapted with permission from "Optimizing Vendor Contract Awards Gets an A-&;" http:// www. 


solver.com/news/optimizing-vendor-contract-awards-gets, 2016 (accessed July 2016). 


ove‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


وتوقعاتنا للطلب على منتجاتنا وتكاليف سلسلة التوريد اتخاذ قرارات بشأن المواقع التي سنقوم 
فيها بإنشاء مستودعاتنا. بالإضافة إلى أن المعلومات الخاصة بأحجام المنتجات التي سيتم تسليمها 
في مواقع مختلفة وتكاليف التسليم وتوافر سيارة للنقل تسمح لنا بتحديد طرق التسليم اليومية. 
ويستطيع الشخص الحصول على مئات الأمثلة الخاصة بالحالات التي تكون فيها القرارات المستندة 
إلى البيانات ذات قيمة. وفي الواقع» فإن القدرة على استخدام رؤى وصفية وتنبؤية لمساعدة 
صانع القرار على اتخاذ قرارات أفضل تعد أكبر فرصة متاحة لمهنة التحليلات المتنامية. وعلى 
الرغم من وجود حالات يتم اتخاذ القرارات فيها من خلال الاعتماد على الخبرة والحدسء غير 
أن الأرجح أن القرارات التي يدعمها نموذج ما ستساعد صانع القرار على اتخاذ قرارات أفضل. 
وبالإضافة إلى ذلك déf‏ فإن هذه القرارات التي يدعمها نموذج ما ستوفر لصانعي القرار مبررات 
للتوصيات التي يقدمونها. وهكذا برزت التحليلات التوجيهية باعتبارها أقصى ما انتهى إليه العلم 
في مجال التحليلات ليتم تطبيقه لاحقًاء وهي تنطوي بشكل أساسي على استخدام نموذج تحليلي 
للمساعدة في توجيه صانع القرار في اتخاذ القرارء أو جعل عملية اتخاذ القرار عملية آلية وذلك 
حتى يتمكن النموذج من تقديم توصيات أو قرارات. ونظرًا لأن التحليلات التوجيهية تركز على 
تقديم التوصيات أو اتخاذ القرارات» فإن البعض يسمي هذه الفئة من التحليلات بتحليلات القرار. 
وتتضمن جميع منشورات 1117012315 مثل Mla læg ORMS TODAY 3 Interfaces‏ 
Analytics‏ القصص التي توضح التطبيقات الناجحة لنماذج القرار في الإعدادات الحقيقية. 
ويشتمل هذا الفصل على العديد من الأمثلة على مثل هذه التطبيقات التحليلية الإرشادية. وتجدر 
بنا الإشارة إلى أن تطبيق نماذج لحالات واقعية يمكنها أن توفر ملايين الدولارات أو تدر عائدًا بملايين 
الدولارات. وقد وصف Christiansen jo JS‏ وآخرون (۲۰۰۹) تطبيقات هذه النماذج في عمليات 
شركة الشحن باستخدام 116001801116 بأنها نظام دعم القرار (1055) لتوجيه السفن والجدولة, 
وهم يدعون أن الشركة استخدمت هذا النموذج على مدى ثلاثة أسابيع لتحسين الاستفادة من 
أسطولهاء الأمر الذي أدى إلى تحقيق ربح إضافي يتراوح من مليون إلى مليوني دولار في مثل هذه 
الفترة الزمنية القصيرة. وفي الحالة العملية (V7‏ نقدم مثالًا آخر لتطبيق نموذج. 
حالة عملية ١-5‏ 
النقل الأمثل للبيانات من الخادم 2:ه]10017115 لشركة إكسون ExxonMobil Jy gs‏ 
من خلال نظام دعم القرار DSS‏ 
شركة إكسون موبيل هي شركة بترول وغاز طبيعيء وتعمل في العديد من البلدان 
في جميع أنحاء العالم. وتوفر الشركة ا منتجات البترولية ا مختلفةء ها في ذلك الوقود 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oro‏ 


الفصل السادس 


النظيف» ومواد التشحيم» واممنتجات ذات القيمة العالية بالإضافة إلى ا مواد الخام 
للعديد من العملاء. ويتم استكمال ذلك من خلال سلسلة توريد معقدة بين مصافيها 
وعملائها. ويعد زيت غاز التفريغ ISI iad l olah a] ga vacuum (VGO)‏ 
esz55. transports àl8LJl ExxonMobil‏ شركة إكسون موبيل Jā» ExxonMobil‏ 
العديد من السفن امُحملة بشحنات 10305منداة زيت غاز التفريغ ۷60 من أوروبا إلى 
الولايات المتحدة. وتشير التقديرات إلى أن إكسون موبيل تقوم بنقل حوالي من ٠١-1١‏ 
سفينة محملة بزيت غاز التفريغ VGO‏ عبر المحيط الأطلسيء في العام الواحد. وقد كان 
من المقرر حتى الآن أن تتم عملية نقل زيت غاز التفريغ ©1160 عبر المحيط الأطلسي 
من خلال عملية نقل يدوية مرهقة سواء تم هذا النقل من خلال السفن التي تديرها 
شركة إكسون موبيل أو سفن طرف ثالث dhig .slgw 4> e third-party‏ العملية 
برمتها تعاون العديد من الافراد عبر منظمة سلسلة التوريد. ولتحديد الجدول الزمني 
للنقل الخاص بالسفن فإنه يتم استخدام العديد من جداول البيانات المخصصة ذات 
القيود والمتطلبات الخاصة والمقايضات الاقتصادية. وقد شملت بعض القيود ما يلي: 

-١‏ تفاوت توقعات الإنتاج والطلب بصفة دائمة. 

۲- قيود الحد الأدنى والحد الأقصى من المخزون. 

-٠'‏ مجموعة من السفن المتنوعة (مثل: السفن ذات السرعات المتفاوتة وحجم البضائع). 

ع- السفن التي يتم تنزيلها وتفريغها في منافذ متعددة. 

US -0‏ من إكسون موبيل المُدارة ومستلزمات الطرف الثالث والمنافل. 

1- تكلفة النقل المعقدة والتي تتضمن تغطية زيادة التكاليف وغرامات التأخير. 

/ا- حجم السفينة وحدود المسارات للمواني المختلفة. 

ويتعذر على العملية اليدوية القيام بتحديد المسارات الفعلية للسفن» وتوقيت كل 
سفينة: وكمية زيت غاز التفريغ ©76 المحملة أو المفرغة. وبالإضافة إلى ذلك فإن 
بيانات الإنتاج والاستهلاك في عدة مواقع جعلت العملية اليدوية مرهقة وغير فعالة. 

ا منهجية / الحل: 

وقد تم تطوير أداة دعم القرار التي تساعد المُجدولين على التخطيط لجدول زمني 
مثالي للسفن لتنزيل» ونقلء وتفريخ زيت غاز التفريخ ۷60 من وإلى عدة مواقع. وقد تم 
صياغة المشكلة كمشكلة البرمجة الخطية العددية. وقد كان من الضروري أن يلبي الحل 


ova‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


المتطلبات الخاصة بالتوجيهء والنقل: والجدولةء وإدارة ا مخزون إزاء تباينات الإنتاج والطلب 
المختلفة. وقد استُخدمّت لغة البرمجة الرياضية 681315 لصياغة المشكلة: كما استُخدم 
مايكروسوفت إكسل 8:1 :2116:0501 كواجهة المستخدم. وعندما يتم تشغيل آلة الحل 
051:82 11.0©6) فإنه يتم التوصل إلى حل أمثل في نقطة تتوقف فيها القيمة الموضوعية 
للحل الحالي عن التحسنء حيث يتم تحديد معيار التوقف خلال كل برنامج تشغيل. 

النتائج / الفوائد: 

ومن المتوقع أن يؤدي استخدام نموذج التحسين إلى خفض تكاليف الشحن بالإضافة 
إلى خفض النفقات الخاصة بغرامات التأخير. ونظرًا لأن الأداة ستكون قادرة على دعم 
استخدام السفن بطريقة أفضل كما أنها تساعد في اختيار السفن (مثل: :همه 
مقابل هدص .ة) وتصميم جداول التوجيه الأمثل» فإن ذلك من شأنه تحقيق هدف 
خفض تكاليف الشحن بالإضافة إلى خفض النفقات الخاصة بغرامات التأخير. وينوي 
الباحثون مواصلة البحث عن طريق استكشاف أساليب رياضية أخرى بديلة من أجل 
حل مشكلة الجدولة. كما أنهم يعتزمون أيضًا منح أداة أنظمة دعم القرار القدرةً على 
النظر في منتجات متعددة لمجموعة من السفن. 

أسئلة للمناقشة: 

-١‏ اذكر ثلاث طرق توضح كيف يمكن أن تؤدي الجدولة اليدوية للسفن إلى تحمّل 
المزيد من التكاليف التشغيلية مقارنةً بالأداة التي تم تطويرها. 

۲- كيف يكن لشركة إكسون موبيل الاستفادة بطرق أخرى من أدوات دعم القرار 
التي تم تطويرها من أجل توسيع وتحسين عملياتها التجارية الأخرى؟ 

۴- ما هي بعض القرارات الإستراتيجية التي يمكن اتخاذها من قبل صناع القرار 
باستخدام الأداة التي تم تطويرها؟ 
Source: Adapted from Furman, K. C., Song, J. H., Kocis, G. R., McDonald, M. K.,‏ 


& Warrick, P. H. (2011). Feedstock routing in the ExxonMobil downstream sector. 
Interfaces, 41(2), 149163-. 


أمثلة نموذج تحليلات توجيهية: 
تعتمد التحليلات التوجيهية على النمذجة كعنصر أساسي. وفي الأمثلة التي ذكرناها آنقًا في 
حالات التقديم والتطبيق ينبغي على الفرد استخدام نموذج رياضي حتى يتمكن من التوصية بقرار 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري orv‏ 


الفصل السادس 


لأي مشكلة واقعية. فعلى سبيل المثالء نجد أن تحديد العميل (من بين ملايين العملاء المحتملين) 
الذي سوف يتلقى عرضًا بغرض تعظيم قيمة الاستجابة الإجمالية مع التقيد بحدود الميزانية» ليس 
بالأمر الذي يمكنك القيام به يدويًا. وبناء نموذج زيادة الاستجابة إلى الحد الأقصى المستند إلى 
الاحتمالية مع التقيد بحدود الميزانيةء من شأنه أن يوفر لنا المعلومات التي ننشدها. واستنادًا إلى 
المشكلة التي نتناولهاء فإن هناك فئات عديدة من النماذجء بالإضافة إلى أنه غالبًا ما يكون هناك 
العديد من التقنيات المتخصصة لحل كل مشكلة منها. وفي هذا الفصل سوف نتعرف على اثنين من 
أساليب النمذجة المختلفة. ومن الجدير بالذكر أن معظم الجامعات لديها العديد من الدورات 
التدريبية التي تغطي هذه الموضوعات تحت عناوين مختلفة مثل بحوث العمليات» وعلوم الإدارة, 
ونُظم دعم القرارء والمحاكاة التي يمكنها مساعدتك في بناء المزيد من الخبرات في هذه المواضيع. 
ونظرًا لأن التحليلات التوجيهية تنطوي عادةً على تطبيق نماذج رياضية» فإن مصطلح علم البيانات 
أحيانًا يرتبط بتطبيق مثل هذه النماذج الرياضية بشكل أكثر انتشارًا. وقبل أن نتعرف على دعم 
النمذجة الرياضية في التحليلات التوجيهية» دعونا نفهم أولًا بعض مشاكل النماذج. 
تحديد المشكلة والتحليل البيئي: 

لا يتم اتخاذ القرارات من فراغ بل لابد من تحليل نطاق المجال وقوى وديناميكيات البيئة, 
حيث يحتاج صانع القرار إلى تحديد الثقافة التنظيمية وعمليات صنع القرار في الشركات (على 
سبيل المثال: من يقوم باتخاذ القرارات» ودرجة المركزية). فمن الوارد أن يكون ظهور المشكلة 
الحالية سببه العوامل البيئية» وهذا قد يسمى بشكل رسمي المسح والتحليل البيئي» ويقصد به 
رصد المعلومات المجمعة ومسحها وتفسيرها. ويمكن لأدوات ذكاء الأعمال / تحليلات الأعمال 
(81/84) أن تساعد في تحديد المشاكل عن طريق القيام بعملية مسح لها. وينبغي أن تكون 
المشكلة مفهومة جيدًا كما يجب أن يشارك الجميع نفس إطار الفهم نظرًا لأن المشكلة سوف 
يتم تمثيلها في النهاية بالنموذج بشكل أو بآخر. وبغير ذلكء فإن النموذج لن يساعد صانع القرار. 

تحديد المتغير: يُعد تحديد متغيرات النموذج (مثل: القرارء والنتيجةء وعدم التحكم فيهما)» 
بالإضافة إلى العلاقات بين المتغيرات» أمرًا بالغ الأهمية. ويمكن أن يكون لتأثير الرسوم البيانية 
-والتي تعد نماذج تخطيطية للنماذج الرياضية - دور في تسهيل عملية التحديد. كما قد يساعد 
شكل أكثر عمومية لرسم بياني مؤثر وخريطة معرفية» gilo‏ القرار على تطوير فهم المشكلة 
بشكل أفضلء لاسيما المتغيرات وتفاعلاتها. 

التنبؤ (تحليلات توجيهية): وكما ذكرنا سابقًاء فإن معرفة ما حدث وما هو محتمل حدوثه 
يُعد شرطًا أساسيًا هاما للتحليلات التوضيحية. ويُعتبر هذا النوع من التحليلات التنبؤية ضروريًا 


OYA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


لبناء النماذج ومعالجتها نظرًا لأن النتائج المترتبة على تنفيذ القرار عادةً ما تظهر في المستقبل. 
وليس هناك جدوى من إجراء تحليل لمعرفة مدى (الاستجابة) على ما وقع في الماضي لأن القرارات 
التي سيتم اتخاذها في ذلك الوقت لن تُجدي نفعًا في المستقبل. وتتطلب التجارة عبر الإنترنت 
والاتصالات التنبؤ بما قد يحدث وتوافر المعلومات المتاحة من أجل أدائها. وهذه الأنشطة تحدث 
Äe pus‏ بعد جمع المعلومات حول المشتريات والتي ينبغي تحليلها للوصول إلى التوقعات. حيث 
ينطوي جزء من التحليل ببساطة على التنبق بالطلب؛ ومع ذلك فإن نموذج التنبؤ يمكنه استخدام 
احتياجات دورة حياة المنتج والمعلومات التي تتعلق بالسوق وا مستهلكين لتحليل الوضع بأكمله. 
مما يؤدي إلى زيادة مبيعات المنتجات والخدمات بشكل مثالي. 

وفي الحالة العملية (١-؟)‏ سوف نقدم وصقًا لمثال فعال لمثل هذه التنبؤات واستخدامها في صنع القرار. 


حالة عملية ٠١-5‏ 
استخدام تطبيقات ذكاء الأعمال من قبل شركة إنجرام مايكرو 3110 18۲4۳ من 
أجل اتخاذ قرارات التسعير 

تعد شركة إنجرام laڍڌرg Ingram Micro‏ هي أكبر موزع ثنائي ال مستوى طنتجات 
التقنية في العالم. وتقوم الشركة في نظام التوزيع ذي الشقين: بشراء المنتجات من الشركات 
امصنعة لها ومن تم تقوم ببيعها لتجار التجزئة الذين يقومون بدورهم ببيع هذه المنتجات 
للمستخدمين النهائيين. فمثلًا. يمكن شراء حزمة 365 (ys Microsoft Office‏ شركة 
إنجرام Vos Ingram Micro s&il‏ من شرائها مباشرة من مايكروسوفت (Microsoft)‏ 
وترتبط شركة إنجرام بالعديد من الشراكات مع شركات مثل تإناظ «Buffalos .Best‏ و 
Honeywell Google‏ بالإضافة إلى .Sharper ]mageو Libratone‏ وتقوم الشركة 
بتسليم منتجاتها إلى ۲٠٠٠٠١‏ مزود حلول في جميع أنحاء العالم» وبالتالي فإن الشركة لديها 
حجم كبير من بيانات المعاملات. ولتحديد فرص البيع المتقاطع وتحديد الأسعار التي 
يتم تقدهها لعملاء محددين بالتزامن مع حزم ال منتجات» أرادت شركة إنجرام استخدام 
الإحصاءات من هذه البيانات» مما يتطلب إنشاء مركز ذكاء الأعمال (810) من أجل 
تجميع وتحليل البيانات. وقد واجهت شركة إنجرام العديد من المشاكل في إعداد -BIC‏ 

-١‏ واجهت شركة إنجرام مشاكل عديدة ف عملية التقاط البيانات الخاصة بهم مثل 
نقص بيانات الخسائرء وضمان دقة معلومات المستخدم النهاي؛ وربط الاقتباسات بالأوامر. 

۲- أيصًا واجهت شركة إنجرام مشاكل في تنفيذ نظام إدارة علاقات العملاء (CRM)‏ 
بحيث يكون قادرًا بما يكفي للتعامل مع عملياته في جميع أنحاء العام. 

ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oya‏ 


الفصل السادس 


"- بالإضافة إلى ما سبقء فقد واجهت الشركة تصدي لفكرة تسعير الطلب (تحديد 
السعر وفقًا للإقبال على المنتج). 

امنهجية / الحل: 

استكشفت شركة إنجرام البريد الإلكتروني واستخدمته في التواصل المباشر مع عملائها 
(البائعين) وقدمت لهم خصومات على شراء التقنيات الداعمة المتعلقة بالمنتجات 
المطلوبة. ومن خلال تحليل سلة السوق المجزأة استطاعوا تحديد هذه الفرص ومن 
تم طوروا تطبيقات ذكاء الأعمال التالية التي ساعدت في تحديد الأسعر المثلى. كما 
قامت إنجرام بتطوير أداة جديدة لتحسين الأسعار وتعرف IMPRIME gub‏ وهذه 
الأداة يمكنها تحديد الأسعار القائمة على البيانات بالإضافة إلى قدرتها على توفير إرشادات 
التفاوض المستندة إلى البيانات. حيث تحدد :1115101311 السعر الأمثل لكل مستوى 
من مستويات التسلسل الهرمي للمنتج (مثل: مستوى العميل» ومستوى البائع-العميلء 
ومستوى شريحة العميلء ومستوى شريحة البائع-العميل). وهي تقوم بفعل ذلك من 
خلال مراعاة المفاضلة بين إشارة الطلب والتسعير عند ذلك المستوى. 

كما قامت الشركة بتطوير برنامج تسويق رقمي يُعرف باسم 1241/1 1216 ععمعن ذ1اع امل 
حيث يستخدم هذا البرنامج التسجيل الإرشادي التنبؤي (51:5)؛ والذي يحدد 
المستخدمين النهائيين المستهدفين ببرامج تسويقية محددة. ويُعد (51:5) هو نظامهم 
الذي يُستخدم لتسجيل الإرشادات التنبؤية للشركات التي ليس لها علاقة مباشرة مع 
المستخدمين النهائيين. كما يُستخدم برنامج 18161411 1611186068 لتشغيل برامج 
الفضاء الأبيضء Sabl gai loo‏ على شراء المنتجات المرتبطة ببعضها من خلال تقديم 
خصومات. فعلى سبيل المثالء إذا كان المْوَرّد يشتري خادمًا من إنجرام» فعندئذ تقوم 
إنجرام بتقديم خصومات على وحدات تخزين الأقراص نظرًا للترابط بين المنتجينء حيث 
Jillg Lo Jal bolha kyi!‏ فإنه یتم استخدIم‏ تıiة Intelligence INGRAM‏ 
من أجل تطوير الحملات التحفيزية (وذلك من خلال تقديم مكافآت نقدية للموردين 
على تجاوز أهداف الإنفاق الربع سنوية)» وحملات البيع المتبادل (إرسال البريد الإلكتروني 
للمستخدمين بخصوص النتجات المرتبطة با منتج الذي تم شراؤه مؤخرًا). 

النتائج / القوائد: 

وتُستخدم منهجية قياس الرفع لقياس الأرباح الناتجة وذلك عن طريق استخدام 
أداة IMPRIME‏ حيث تقوم هذه المنهجية (منهجية قياس الرفع) بمقارنة الفترات قبل 


ote‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


وبعد تغيير الأسعار كما تقوم بمقارنة مجموعات الاختبار مقابل مجموعات التحكم. 
ويتم إجراء قياس الرقع على متوسط المبيعات اليوميةء والهامش الإجمالي» وهامش 
الماكينة. وقد أدى استخدام أداة 1315101347 إلى نمو في الإيرادات بلغ ۷0۷ مليون دولار 
وزيادة في إجمالي الأرباح بلغت ۱۸,۸ مليون دولار. 

أسئلة للمناقشة: 

-١‏ ما هي أهم التحديات التي واجهتها إنجرام مايكرو 11150 دصهعم1 في تطوير 810؟ 

Sò -Y‏ جميع حلول ذكاء الأعمال التي طورتها شركة إنجرام لتحسين أسعار منتجاتها 

۳- ما هي الفوائد التي حصلت عليها إنجرام بعد استخدام تطبيقات ذكاء الأعمال 
المطورة حدينًا؟ 

ما الذي يمكن أن نتعلمه من هذه الحالة العملية؟ 

تستطيع الشركة أن تبدأ بفهم خطوط منتجاتهاء وعملائهاء بالإضافة إلى أنماط الشراء 
الخاصة بهم بشكل أفضلء من خلال بناء 810 لأول مرة. وتُستمّد هذه البصيرة من ما 
نسميه بالتحليلات الوصفية والتنبؤية. وبالإضافة إلى ذلك فإن القيمة من هذا تُستَمّد 
من خلال تحسين الأسعارء وهو أحد مجالات التحليلات التوجيهية. 
Sources: Mookherjee, R., Martineau, J., Xu, L., Gullo, M., Zhou, K., Hazlewood,‏ 
A., Zhang, X., Griarte, F, & Li, N. (2016). End-to-end predictive analytics and‏ 
optimization in Ingram Micros two-tier distribution business. Interfaces, 46(1), 4973-;‏ 


ingrammicrocommerce.com, "CUSTOMERS; https://www.ingrammicrocommerce. 


com/customers/(accessed July 2016). 


فئات النموذج: 

يصنف الجدول )١1-1(‏ بعض نماذج القرارات إلى سبع مجموعات ويسرد العديد من التقنيات 
ال ممثلة لكل فئة من الفئات؛ حيث يمكن تطبيق كل تقنية إما على نموذج ثابت أو نموذج حري» 
والذي يمكن بناؤه في بيئات مفترضة من التأكد: أو عدم التأكد. أو الخطر. ويمكن استخدام أنظمة 
تحليل القرارات الخاصة والتي يحتوي تصميمها على لغات وإمكانيات نمذجة مدمجة فيهاء بغرض 
تسريع عملية البناء النموذجيةء ويشمل ذلك جداول البيانات» وأنظمة التنقيب ف البيانات» 
وأنظمة ابمعالجة التحليلية عبر الإنترنت (014۶)» ولغات النمذجة التي تساعد المحلل على بناء 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oe!‏ 


الفصل السادس 


نموذج. وسوف نتناول أحد هذه الأنظمة لاحقًا في هذا الفصل. 
إدارة النموذج: وللحفاظ على سلامة النماذجء وبالتالي قابليتها للتطبيق فإنه ينبغي أن تتم 
إدارة النماذج» مثل البيانات؛ حيث تتم هذه الإدارة بمساعدة أنظمة الإدارة القائمة على النماذج» 
والتي تشبه أنظمة إدارة قواعد البيانات (081315). 
النمذجة المستندة إلى ا معرفة: تستخدم أنظمة دعم القرار النماذج الكمية في الغالب» في حين 
تستخدم النظم الخبيرة نماذج نوعية تعتمد على المعرفة في تطبيقاتها. الجدير بالذكر أن بعض المعرفة 
تكون ضرورية لبناء نماذج قابلة للحل (وبالتالي فإنها تكون قابلة للاستخدام). ولبناء نماذج قائمة على 
المعرفة» فإنه يمكن استخدام العديد من تقنيات التحليلات التنبؤية» مثل: التصنيف والتجميع. 


الفئة 
البحث عن الحل الأمثل للمشاكل 


من خلال بعض البدائل القليلة. 


البحث عن الحل الأمثل عن 
طريق خوارزمية. 


البحث عن الحل الأمثل من 


المحاكاة. 


الاستدلال. 





ocr 





جدول 1-5: فتات النماذج 
العملية والهدف 


البحث عن أفضل حل من بين 
عدد قليل من البدائل. 


البحث عن أفضل حل من بين 
عدد كبير من البدائلء باستخدام 
عملية التحسين خطوة بخطوة. 
البحث عن أفضل الحلول في 
خطوة واحدة باستخدام صيغة ما. 
البحث عن حل جيد بدرجة كافية 
أو الحل الأفضل من بين البدائل 
التي تم فحصهاء وذلك من خلال 
استخدام التجريب. 

العثور على حل جيد بدرجة كافية. 
عن طريق استخدام القواعد. 


4 





التقنيات اممثلة 


جداول القرارات» وأشجار 
القراره وعملية التسلسل الهرمي 
التحليلي. 


نماذج البرمجة الخطية والرياضية 
الأخرىء ونماذج الشبكات. 


بعض نماذج المخزون. 


عدة أنواع من المحاكاة. 


برمجة إرشادية» وأنظمة خبيرة. 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 























التحليلات التوجيهية: التحسين والمحاكاة 


الفتة العملية والهدف التقنيات الممثلة 

نماذج تنبؤية. التنبؤ بامستقبل بالنسبة لسيناريو أ نماذج التنبؤء وتحليل ماركوف 
معين. .Markof‏ 

نماذج أخرى. وضع حل في حالة ”ماذا - لو". | النمذجة امالية. وخطوط 
باستخدام صيغة ماء الانتظار. 














الاتجاهات الحالية في النمذجة: ينطوى أحد الاتجاهات الحديثة في النمذجة على تطوير مكتبات 
نموذجية ومكتبات تقنية الحل. وبعض هذه الرموز يمكن تشغيلها مباشرةً على خادم الويب الخاص 
lxs UU‏ والبعض الآخر يمكن تنزيله وتشغيله على جهاز حاسب محليء حيث إن توافر هذه 
الرموز يعني أن حزم التحسين والمحاكاة القوية متاحة لصانعي القرار الذين من الممكن أن يقوموا 
باختبار هذه الأدوات فقط من منظور مشاكل الفصل الدراسي. فعلى سبيل المثالء يحتفظ قسم 
الرياضيات وعلوم الحاسب في مختبر أر 2 55 (Argonne, Illinois) Argonne National, Jil‏ 
بخادم 95 من أجل التحسين LS. .https;//neos-server.org/neos/index.html x35 Je‏ 
يمكنك العثور على روابط مواقع أخرى عن طريق النقر على رابط الموارد في ا موقع. ع0۲ امموقع 
الإلكتروني لمعهد بحوث العمليات وعلوم الإدارة (121801315), حيث يوفر 171701215 معلومات 
غزيرة حول النمذجة والحلول. ويمثل موقع رة له 08/215 الموقع الإلكتروني لأحد منشورات 
INFORMS‏ وهو متاح على: shortly paas LS .http://www.ormstoday.org/ormsmain‏ 
روابط للعديد من فئات برامج النمذجة. وسوف نتناول بعضًا منها قريبًا. 

وهناك اتجاه واضح نحو تطوير واستخدام أدوات وبرامج تسمى 0110-08564ك من أجل 
الوصول إلى البرامج وحتى تشغيلها من أجل أداء النمذجة والتحسين وامحاكاة وما إلى ذلك. وهذا 
يبسط تطبيق العديد من النماذج ممشاكل العام الحقيقي بطرق عديدة. ومع ذلك فمن الضروري 
اكتساب الخبرة جيدًا من خلال تطوير الحلول البسيطة»ء وذلك من أجل استخدام النماذج وتقنيات 
الحلول بفاعلية. وغالبًا ما يتم تجاهل هذا الجانب. فالمنظمات التي لديها مُحللين رئيسين والذين 
يدركون بالفعل كيفية تطبيق النماذج» يطبقونها بفاعلية كبيرة. وهذا يحدث بشكل ملحوظ في 
منطقة إدارة الإيرادات» والتي انتقلت من مقاطعة شركات الطيران والفنادق وتأجير السيارات 
إلى التجزئة والتأمين والترفيه والعديد من المجالات الأخرى. كما أن gòl pasias LÉ CRM‏ 
غير أنها غالبًا ما تكون شفافة للمستخدم. وتعتبر كمية البيانات وأحجام النماذج كبيرة Z lás‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oer‏ 














الفصل السادس 


النماذج الإدارية» مما يستدعي استخدام مستودعات البيانات لتوفير البيانات وأجهزة الحوسبة 
المتوازية للحصول على حلول في إطار زمني معقول. 

كما أن هناك اتجاهًا مستمرًا نحو جعل نماذج التحليلات واضحة تمامًا لصانع القرار. فعلى 
JÈL duw‏ ينطوى التحليل متعدد الأبعاد (النمذجة) على تحليل البيانات ف أبعاد متعددة. 
وتظهر البيانات بشكل عام في التحليل متعدد الأبعاد (النمذجة) على شكل جدول بيانات» بحيث 
يكون معظم صناع القرار على دراية بها. ويستخدم الآن العديد من صناع القرار الذين اعتادوا 
على تشريح وتقطيع مكعبات البيانات» أنظمة 01.47 التي تصل إلى مستودعات البيانات. وعلى 
الرغم من أن هذه الطرق قد تجعل النمذجة مستساغة: إلا أنها أيضًا تخرج العديد من فئات 
النماذج الهامة والقابلة للتطبيق من الاعتبارء كما أنها تقضي على بعض جوانب تفسير الحلول 
الهامة والدقيقة. وتتضمن النمذجة ما هو أكثر بكثير من مجرد تحليل البيانات مع خطوط 
الاتجاه وإقامة علاقات مع الأساليب الإحصائية. 

وهناك أيضًا اتجاه لبناء نموذج من نموذج للمساعدة في تحليله بحيث يكون الرسم التخطيطي 
المؤثر عبارة عن تمثيل بياني لنموذج؛ وهذا هو ما يُقصد به نموذج من نموذج. كما أن بعض حزم 
برامج الرسم التخطيطي المؤثرة تستطيع إنشاء وحل النموذج الناتج. 
أسئلة مراجعة على القسم 7-5: 
-١‏ اذكر ثلاثة دروس مستفادة من النمذجة. 
- اذكر مع الوصف المشاكل الرئيسة في النمذجة. 
- ما هي الأنواع الرئيسة من النماذج المستخدمة في 51055 
-E‏ اذا لا يتم استخدام النماذج في الصناعة بشكل متكرر كما ينبغي أو كما يمكن أن تكون؟ 
ه- ما هي الاتجاهات الحالية في النمذجة؟ 


8-5 هيكل النماذج الرياضية لدعم القرار: 
في الأقسام التالية سوف نتناول موضوعات النماذج الرياضية التحليلية (كالنماذج الرياضية 
والمالية والهندسية). وسوف يتضمن ذلك polis‏ وهياكل النماذج. 


ott‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


مكونات النماذج الرياضية لدعم القرار: 

تتكون جميع النماذج الكمية عادةً من أربعة عناصر أساسية (انظر الشكل »)١-1‏ وهي: متغيرات 
النتيجة (أو الحصيلة (outcome‏ ومتغيرات القرار» والمتغيرات الغير قابلة للتحكم (أو المَعْلّمات 
25 بالإضافة إلى متغيرات النتائج المتوسطة: حيث تقوم العلاقات الرياضية بربط هذه 
العناصر ببعضها البعض. وتكون العلاقات رمزية أو نوعية في النماذج غير الكمية. وبناءً على القرار 
ا متخذ (أي: قيم متغيرات القرار)» والعوامل التي لا يمكن التحكم فيها من قبل صانع القرار (في البيئة)» 
والعلاقات بين المتغيرات» فإنه يتم تحديد نتائج القرارات. وتنطوي عملية النمذجة على تحديد المتغيرات 
والعلاقات فيما dao‏ حيث يُحدد حل النموذج قيم هذه المتغيرات ومتغير (متغيرات) النتيجة. 


متغيرات غير قابلة 
للتحكم فيها 


متك الت | العلاقات الرياضية || متغير القرار 














شكل 1-5: الهيكل العام لنموذج كمي 

متغيرات النتيجة (outcome áL.a2JI) à 24zJI Slys yK (OUTCOME i Lav)‏ 
مدى فاعلية النظام؛ بمعنى أنها تشير إلى مدى جودة النظام أو تحقيق هدفه (أهدافه). وهذه 
المتغيرات هي مخرجات. وقد وردت أمثلة لمتغيرات النتائج في الجدول .)١-1(‏ وتعتبر متغيرات 
النتائج متغيرات تابعة. كما ُستخدم متغيرات النتائج المتوسطة أحيانًا في النمذجة لتحديد النتائج 
المتوسطة. وفي حالة المتغير التابع» ينبغي أولًا وقوع حدث آخر قبل وقوع الحدث الموصوف بواسطة 
المتغير. وتعتمد متغيرات النتائج على حدوث متغيرات القرار والمتغيرات التي لا يمكن التحكم فيها. 

متغيرات القرار: تصف متغيرات القرار مسارات بديلة للعمل. ويتحكم صانع القرار في 
متغيرات القرار. فعلى سبيل المثال» بالنسبة لمشكلة الاستثمار. فإن مبلغ الاستثمار في السندات 
هو متغير القرار. وفي مشكلة الجدولةء فإن متغيرات القرار تكون أشخاصًا وأوقانًا وجداول. وقد 
وردت أمثلة أخرى في الجدول (7-5). 

المتغيرات الغير قابلة للتحكم أو المَعْلّمّات 5:عاءدمههدم: هناك عوامل تؤثر على متغيرات 
النتائج في أي موقف لاتخاذ القرارء غير أن هذه العوامل خارج نطاق سيطرة صانع القرار. وهذه 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oto‏ 














الفصل السادس 


العوامل إما أن تكون ثابتة» وفي هذه الحالة تسمى متغيرات غير قابلة للتحكم. أو colas‏ 
«parameters‏ وإما أن تكون قابلة للتغين وفي هذه الحالة تسمى المتغيرات. ومن أمثلة العوامل 
سعر الفائدة الأساسي ورمز المباني في المدينة واللوائح الضريبية وتكاليف المرافق. ومعظم هذه 
العوامل لا يمكن التحكم فيها نظرًا لكونها موجودة ومحددة من قبل عناصر بيئة النظام التي 
يعمل فيها صانع القرار. كما أن بعض هذه المتغيرات häl glo Ki‏ وبالتالي فإنها تُشَكل ما 
يُسمى بالقيود المفروضة على المشكلة. 

متغيرات النتائج المتوسطة: تعكس متغيرات النتائج المتوسطة الحصيلة المتوسطة في النماذج 
الرياضية. فمثلًاه عند تحديد جدولة الآلة» فإن التلف يكون هو متوسط متغير الناتج» ويكون 
الربح الإجمالي هو متغير النتيجة (أي إن التلف هو أحد العوامل المحددة لإجمالي الربح). ومثال 
آخر: هو رواتب الموظفينء ويُشكل هذا متغير قرار الإدارة؛ إذ يحدد مدى ارتياح الموظفين (أي: 
الحصيلة المتوسطة)ء والذي يحدد بدوره مستوى الإنتاجية (أي: النتيجة النهائية). 


الاستثمار ا مالي 


المحاسبة 





o1 





جدول 7-5: أمثلة لعناصر النماذج 


متغيرات القرار 


بدائل الاستثمار ومبالغه 


ميزانية الإعلان 
مكان الإعلان 
نوعية المنتج وكميته 
مستويات المخزون 
برامج التعويض 


استخدام أجهزة الحاسب 
جدول التدقيق 





متغيرات النتيجة 
مجموع الربح» والخطر 
معدل العائد على الاستثمار )۸0١1(‏ 
ربحية السهم 
مستوى السيولة 
الحصة التسويقية 
Maali lö;‏ 
التكلفة الإجمالية 
مستوى الجودة 
ارتياح الموظف 


تكلفة معالجة البيانات 
نسبة الخطأ 





متغيرات وَمَعْلَمَات 


غير قابلة للتحكم 


معدل التضخم 
معدل الفائدة 
ا منافسة 


دخل العميل 
إجراءات المنافس 

سعة الماكينة 

التقنية 

أسعار المواد 

تقنية الحاسب 
معدلات الضرائب 
المتطلبات القانونية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 























التحليلات التوجيهية: التحسين والمحاكاة 














3 متغيرات ومَعْلَمَات 

المنطقة متغيرات القرار متغيرات النتيجة 8 
1 غير قابلة للتحكم 
تكلفة النة 
جدول الشحنات 2 P 1 ES‏ مسافة التسليم 
وسائل النقل _ | قيمة وقت الفراغ Payment‏ * 
استخدام البطاقات الذكية القوانين 
float time 5 g‏ 0 

الخدمات مستويات التوظيف | ارتياح العملاء الطلب على الخدمات 


هيكل النماذج الرياضية لدعم القرار: 
ترتبط عناصر النموذج الكمي بواسطة التعبيرات الرياضية (الجبرية) - المعادلات أو التباين. 
وفيما يلي نموذج مالي بسيط P =R -C li>‏ 
حيث 5 - الربح. و1 - الإيرادات؛ ون) - التكلفة. وتصف هذه المعادلة العلاقة بين المتغيرات. 
وهناك نموذج مالي آخر معروف هو نموذج التدفق النقدي البسيط للقيمة الحالية حيث ۴ = القيمة 
الحالية» و1 - دفعة واحدة مستقبلية بالدولار. و1 - سعر الفائدة (النسبة المئوية)؛ و1= عدد 
السنوات. ويمكن مع هذا النموذج تحديد القيمة الحالية لدفع مبلغ 5٠٠١٠٠١‏ يتم سداذه بعد ه 
سنوات من اليوم» معدل فائدة ۱۰ (۰,۱)» على النحو التالي: ۲ = ٠١١٠٠٠١‏ / (1 + اره) 0ح للقدرلة. 
وفيما يلي من أقسام سوف نقدم نماذج رياضية أكثر تشويقًا وتعقيدًا. 
أسئلة مراجعة على القسم 5-: 
-١‏ ما هو متغير القرار؟ 
؟- اذكر وناقش بإيجاز العناصر الرئيسة للنموذج الكمي. 
۳- اشرح دور متغيرات النتائج المتوسطة. 
٠-٠‏ التأكدء وعدم التأكد والخطر: 
تنطوي عملية اتخاذ القرار على تقييم ومقارنة البدائل. ومن الضروري خلال هذه العملية 
التنبؤ بالنتائج المستقبلية لكل بديل مقترح. وغالبًا ما يتم تصنيف حالات القرار على أساس ما 
يعرفه (أو ما يعتقده) صانع القرار بشأن النتائج المتوقعة. وعادةً ما نقوم بتصنيف هذه المعرفة 
إلى ثلاث فئات (انظر الشكل 7-1). بدءًا من المعرفة الكاملة إلى الجهل الكاملء وهي: 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري otv‏ 














الفصل السادس 


- التأكد. - عدم التأكد. - الخطر. 

وقد تحدث أي حالة من هذه الحالات عندما نقوم بتطوير النماذج» ولكل حالة أنواع 
مختلفة من النماذج تكون مناسبة لها. وفيما يلي سوف نناقش كلا من التعريفات الأساسية لهذه 
المصطلحات وبعض قضايا النمذجة الهامة لكل حالة. 


| الجهل التام p‏ المعرفة الكاملة 
| عدم التأكد apaa‏ التأكد 
| 








:Y- JS‏ مناطق اتخاذ القرار 
اتخاذ القرار في ظل التأكد: 

من المفترض أن المعرفة الكاملة تكون متاحة بالنسبة لصانع القرار عند اتخاذ القرار في ظل 
التأكدء بحيث يكون صانع القرار على علم تام بنتيجة كل مسار من العمل (كما لو كان في بيئة 
حتمية). وقد لا يكون صحيحًا أن معرفة النتائج تكون بنسبة ٠٠١‏ كما لا يلزم إجراء تقييم 
حقيقي لكل النتائج» غير أنه غالبًا ما يقوم هذا الافتراض بتبسيط النموذج ويجعله قابلًا للتتبعع 
حيث يُنظر إلى صانع القرار على اعتبار أنه متنبئ مثالي للمستقبل نظرًا لأنه من المفترض أن هناك 
نتيجة واحدة فقط لكل بديل. فعلى سبيل المثالء بديل الاستثمار في سندات الخزانة الأمريكية 
هو الذي تتوفر به معلومات كاملة حول عائد الاستثمار المستقبلي إذا تم الاحتفاظ به حتى 
الاستحقاق. وغالبًا ما تحدث حالة اتخاذ القرار في ظل التأكد. مع مشاكل هيكلية وآفاق زمنية 
قصيرة (تصل إلى سنة واحدة). وتّعد النماذج القائمة على التأكد سهلة نسبيًا في تطويرها وحلهاء 
كما يمكنها تقديم الحلول المُثلى. ويتم إنشاء العديد من النماذج المالية في ظل تأكد مفترضء على 
الرغم من أن السوق لا يقبل إلا بدرجة تأكد ./٠٠١‏ 


اتخاذ القرار في ظل عدم التأكد: 


في حالة اتخاذ القرار في ظل عدم التأكد. فإن صانع القرار يأخذ في الاعتبار الحالات التي تكون 
فيها عدة نتائج ممكنة لكل مسار عمل. وهذه الحالة على النقيض من وضع الخطرء حيث إن صانع 


OtA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 














التحليلات التوجيهية: التحسين والمحاكاة 


القرار في هذه الحالة لا يعرفء أو لا يمكنه تقدير احتمالية حدوث النتائج الممكنة. ويُعد اتخاذ 
القرار في ظل عدم التأكد أكثر صعوبة من اتخاذه في ظل التأكد بسبب عدم توافر معلومات كافية. 
وينطوي وضع النماذج ممثل هذه الحالات على تقييم موقف صانع القرار (أو المنظمة) تجاه الخطر. 

ويحاول المديرون تجنب حالة عدم التأكد قدر الإمكان: إلى الدرجة التي تجعلهم يستبعدونه 
حتى من مجرد الافتراض. فهم يحاولون الحصول على مزيد من المعلومات بحيث يمكن التعامل 
مع المشكلة في ظل التأكد (لأنه قد يكون «شبه» مؤكد) أو تحت خطر محسوب (أي: مفترض). 
وفي حالة عدم توفر المزيد من المعلومات» ينبغي معالجة المشكلة تبعًا لحالة عدم التأكدء والتي 
قد تكون أقل تحديدًا من الفتات الأخرى. : 


اتخاذ القرار في ظل الخطر (تحليل الخطر): 

يُقصد بالقرار الذي يُتخذ في ظل الخطر (المعروف أيضًا بحالة اتخاذ القرار الاحتمالي أو العشوائي) 
بأنه القرار الذي يجب أن يأخذ فيه صانع القرار بعين الاعتبار عدة نتائج ممكنة لكل بديل» ولكل 
منها احتمال حدوث معين. ومن المفترض أن تكون احتمالات حدوث النتائج ا محددة على المدى 
الطويل معروفة أو هكن تقديرها. ومن خلال هذه الافتراضات» يستطيع صانع القرار تقييم درجة 
الخطر المرتبط بكل بديل (يسمى الخطر المحسوب). ومن الجدير بالذكر أن معظم القرارات 
التجارية الرئيسة يتم اتخاذها في ظل الخطر المفترض. أما تحليل الخطر (أي: الخطر المحسوب) 
فهي طريقة صنع القرار التي تحلل الخطر (بناء على الاحتمالات المعروفة المفترضة) المرتبطة بالبدائل 
المختلفة. ويمكن إجراء تحليل الخطر عن طريق حساب القيمة المتوقعة لكل بديل واختيار البديل 
ذي القيمة المتوقعة الأفضل. وتوضح الحالة العملية (1-”) تطبيقًا واحدًا لتقليل عدم التأكد. 


۳-٦ عملية‎ di 
استخدام الخطوط الجوية الأمريكية نمذجة التكلفة اللازمة لتقييم عدم التأكد من‎ 
عطاءات طرق الشحن‎ 
(۸4)إحدیى أكبر‎ A٥۵ تعد شركة الخطوط الجوية الأمريكية 12 ,365ذاكنة‎ 
شركات الطيران في العالم. وأما الأعمال الأماسية للشركة فتتمثل في نقل الركابء بالإضافة‎ 
إلى أن لديها وظائف فرعية حيوية أخرى تتضمن الشحن الكامل للشاحنات (511) من‎ 
معدات الصيانة وشحنات بنود خدمة المسافرين والتي يمكنها إضافة ما يزيد عن مليار‎ 
دولار في المخزون في أي وقت. وتتلقى 44 عروض عديدة من الموردين استجابة لطلبات‎ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ota‏ 


الفصل السادس 


عروض الأسعار Jda g requests for quotes (RFQs)‏ قوائم الجرد. وقد يزيد إجمالي 
طلبات عروض الأسعار ۸۴۵۶ لثركة 44 عن ٠٠١‏ طلب عرض أسعار في أي عام. ونتيجة 
للعدد الكبير من عروض التسعير وعملية تقديم العطاءات المعقدة الناتجة. فإن عروض 
أسعار الإعلانات تختلف بشكل كبير. وفي بعض الأحيانء فإنه يمكن لعقد واحد الانحراف 
بنحو .“7٠١‏ ونتيجة لهذه العملية المعقدة: فإنه من الشائع قيام الموردين إما بدفع مبالغ 
زائدة أو عدم دفعها من أجل الحصول على خدماتهم. وتحقيقًا لهذه الغاية» فقد أرادت 
شركة الخطوط الأمريكية الجوية بناء نموذج شراء من شأنه تبسيط وتقييم عروض الأسعار 
من الموردين من أجل اختيار عروض أسعار عادلة لكلا الطرفين ومورديهم. 

المنهجية / الحل: 

وقد تم اتخاذ ثلاث خطوات. لتحديد التكلفة العادلة لمنتجات وخدمات امموردينء وهي: 

-١‏ استقصاء المصادر الأساسية (كالمقابلات) والثانوية (كالإنترنت) بحنًا عن الحالة الأساسية 
وبيانات المجال والتي من شأنها الإخبار عن متغيرات التكلفة التي تؤثر على عرض ۴۲1. 

۲- اختيار متغيرات التكلفة بحيث تكون حصرية تبادلية وجماعية شاملة. 

۳- استخدام برنامج تحليل قرار 1021 لتوضيح عدم التأكد. 

bdeg‏ على US‏ فقد استخدمت Megill‏ 5173150 التقريب الموسع لنمذجة 
توزيع الاحتمالات للمتغيرات الأكثر حساسية من حيث التكلفة المستخدمة. وقد تم 
ذلك لحساب التقلبات العالية في عروض الأسعار في النموذج الأولي. 

النتائج / الفوائد: 

تم إجراء اختبار تجريبي على طلبات عروض الأسعار التي جذيت عروض من ست 
ناقلات ۴11. وقد كان من بين العروض الست المقدمة خمسة عروض ضمن ثلاثة 
انحرافات معيارية عن المتوسطء في حين استُبّعدَ السادس. وقد استخدمت 44 في وقت 
لاحق نموذج ۴۲1 للتكلفة اللازمة لأکثر من ۲۰ طلب سعر ۸۴۵۶ من أجل تحديد 
التكلفة العادلة والدقيقة للسلع والخدمات. ومن المتوقع أن يساعد هذا النموذج في 
الحد من الأخطار التي تتعلق إما بالدفع الزائد أو دفع تعويضات للموردين. 

أسئلة للمناقشة: 

-١‏ إلى جانب الحد من خطر الدفع الزائد أو دفع تعويضات للموردين» ما هي بعض 
المميزات الأخرى التي تستطيع شركة 44 أن تستمدها من «تموذج ما ينبغي أن يكون»؟ 


00 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


- هل يمكنك التفكير في المجالات الأخرى التي يمكن استخدام هذا النموذج فيها 
إلى جاثب مجال النقل الجوي؟ 

- ناقش الطرق الأخرى الممكنة التي تستطيع من خلالها شركة 44 أن تحل مشكلة 
دفع مبالغ زائدة ومقدار المدفوعات. 
Source: Adapted from Bailey, M. J., Snapp, J., Yetur, S., Stonebraker, S., Edwards, S.‏ 
A., Davis, A., & Cox, R. (2011). Practice summaries: American Airlines uses should-‏ 


cost modeling to assess the uncertainty of bids for its full-truckload shipment routes. 
Interfaces, 41(2), 194196-. 


أسئلة مراجعة على القسم E-I‏ 
-١‏ وضح معنى القيام بعملية اتخاذ القرار في ظل التأكد المفترضء والخطرء وعدم التأكد. 
۲- كيف هكن التعامل مع مشاكل صنع القرار في ظل التأكد المفترض؟ 
-٠‏ كيف يمكن معالجة مشاكل صنع القرار في ظل عدم التأكد المفترض؟ 
-٤‏ كيف هكن التعامل مع مشاكل صنع القرار في ظل الخطر المفترض؟ 
0-5 نمذجة القرار باستخدام جداول البيانات: 

يمكن تطوير النماذج وتنفيذها في مجموعة متنوعة من لغات البرمجة والأنظمة. ونحن نركز 
في امقام الأول على جداول البيانات (مع إضافاتهم)» ونماذج اللغات, بالإضافة إلى أدوات تحليل 
البيانات الواضحة. وسرعان ما تم الاعتراف بحزم جداول البيانات باعتبارها برنامج تنفيذ هكن 
استخدامه بسهولة من أجل تطوير مجموعة واسعة من التطبيقات في مجال الأعمال والهندسة 
والرياضيات والعلوم. وتشتمل جداول البيانات على الإحصائيات والثوقعات الشاملة: بالإضافة 
إلى التصميمات الأخرىء وقدرات إدارة قواعد البيانات» وا مهام» والروتين. وقد تم تطوير الوظائف 
الإضافية مع تطور حزم جداول البيانات» وذلك من أجل هيكلة وحل فئات معينة من النماذج. 
ومن بين الحزم المضافةء تم تطوير العديد منها من أجل تطوير 255. وتتضمن هذه الوظائف 
الإضافية المرتبطة بأنظمة دعم القرار 5 من: 
(Frontline Systems Inc., solver.com) Solver -‏ 
à (Inc., lindo.com; Lindo Systems 54. J á4lssl gs Lindo laol) !What'sBest -‏ 

أجل الأداء الخطي والغير خطي NUS‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 001 


الفصل السادس 


-(urik Research Software, Inc., jurikres.com) Braincel - 
.(Palisade Corp., palisade.com) Neural Tools الأدوات العصبية‎ - 
„artificial neural networks الشبكات العصبية الاصطناعية‎ - 
للخوارزميات الجينية.‎ )Paاisade‎ Corp) Evolver js - 
لأداء دراسات المحاكاة.‎ )Paاisade‎ Corp) @R1S& الخطر‎ - 

وتتوفر الوظائف الإضافية القابلة للمقارنة مجانًا أو بتكلفة منخفضة جدًا. (يمكنك إجراء 
بحث على الويب حتى تتمكن من الوصول إليها؛ فهي بمثابة إضافة جديدة منتظمة إلى السوق). 
ونظرًا لأن جدول البيانات يضم العديد من الوظائف المالية والإحصائية والرياضية وغيرها من 
الوظائف القويةء فهو يُعد أداة النمذجة الأوسع انتشارًا للمستخدم النهائي. وتستطيع جداول 
البيانات تنفيذ مهام الحلول النموذجية مثل البرمجة الخطية وتحليل الانحدار. وقد تطور جدول 
البيانات إلى أداة مهمة للتحليل والتخطيط والنمذجة )|نظر Farasyn, Perkoz, & Van de Velde,‏ 
Hurley & Balez, 2008; Ovchinnikov & Milner, 2008‏ ;2008(. و تقدم الحالتان العمليتان (6-5) 
و(0-1) تطبيقات مثيرة للاهتمام للنماذج المستندة إلى جداول البيانات في بيئة غير ربحية. 


حالة عملية ٤-٦‏ 
استخدام بنسیلفینيا أدو qشj‏ إكiliwج (Pennsylvania Adoption Exchange)‏ 
لنموذج جدول البيانات من أجل تحسين تطابق الأطفال مع الأسر 
Pennsylvania Adoption Exchange (PAE) mo e‏ 3 عام ۱۹۷٩‏ من قېل 
ولاية بنسلفانيا لمساعدة المقاطعات والوكالات غير الهادفة للربح في العثور على عائلات 
محتملة للأطفال اليتامى الذين لم يقم أحد بتبنّيهم يسبب العمر أو الاحتياجات الخاصة. 
وتحتفظ :281 بسجلات مفصلة عن الأطفال وتفضيلات الأسر التي من المحتمل أن تقوم 
بتبتيهم. كما تبحث عن عائلات للأطفال في جميع المقاطعات ال1۷ في ولاية بنسلفانيا. 
وعد شبكة بنسلفانيا للتبنّي والاستدامة هي المسؤولة على مستوى الولاية عن إيجاد 
منازل دائمة للأيتام. فإذا فشلت الشبكة بعد عدة محاولات في وضع طفل مع عائلةء فإنها 
حينئذ تحصل على مساعدة من .PAE‏ وتستخدم 288 أداة تقييم آلية لتدنسيق وضع 
الأطفال مع العائلات ا مناسبة لهم» حيث تقدم هذه الأداة توصيات للتوفيق من خلال 
حساب النتيجة بين ٠‏ و١٠٠‏ للطفل على ۷۸ زوجًا من قيم سمات الطفل والتفضيلات 


oor‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


العائلية. وقد كافحت 2481 لعدة سنوات من أجل إعطاء توصيات توفيق التبنّي بين 
الأطفال والأسر التي تناسبهم للآخصائيين المسؤولين عن حالات الأطفال. غير أنهم وجدوا 
صعوبة في إدارة قاعدة بيانات واسعة من الأطفال التي تم جمعها بمرور الوقت على 
مستوى جميع المقاطعات ال/11. وقد قدمت خوارزمية البحث الرئيسة توصيات للتوفيق 
أثبتت أنها غير مثمرة للأخصائيين المسؤولين عن الحالات. ونتيجة لذلك؛ فقد زاد عدد 
الأطفال الذين لم يتم تبتّيهم زيادة هائلة وأصبحت الحاجة ملحة لإيجاد أسر لهؤلاء الأيتام. 

المنهجية / الحل: 

بدأت 2458 بجمع المعلومات عن كل من الأيتام والعائلات عن طريق الاستطلاعات 
عبر الإنترنت والتي تشمل مجموعة جديدة من الأسئلة؛ حيث تعمل هذه الأسئلة على 
جمع المعلومات الخاصة بهوايات الطفل وتفضيلات الأخصائيين المسؤولين عن الأطفال 
للعائلات» وفئة الأطفال العمرية المفضلة من قبل العائلات. وقد أنشأ ۴۸۴ والأطباء 
الأخصائيون أداة لتوفيق جداول البيانات» وقد اشتملت هذه الأداة على مميزات إضافية 
إذا ما قورنت بالأداة الإضافية التي استُخدمت سابقًا. ويستطيع الأخصائيون المسؤولون 
عن الحالات في هذا النموذج تحديد أهمية السمات من أجل اختيار عائلة لطفل. 
فمثلاء إذا كانت إحدى العائلات لديها مجموعة محدودة من التفضيلات التي تتعلق 
بنوع الطفلء وعمرهء وعرقه. فإن هذه العوامل يمكن أن تصبح ذات أهمية أعلى. 
وبالإضافة إلى ذلك فإن الأخصائيين المسؤولين عن الحالات يمكنهم أن يعطوا الأفضلية 
حول المقاطعة التي تقيم بها الأسرة. نظرًا لأهمية عامل العلاقة الاجتماعية بالنسبة 
للطفل. وتستطيع لجنة التوفيق باستخدام هذه الأداة مقارنة الطفل والأسرة في كل 
سمة» مما يؤدي إلى جعل قرار التوفيق بين كل من الأسرة والطفل أكثر دقة. 

النتائج / الفوائد: 

منذ أن بدأت 245 باستخدام نموذج جدول البيانات الجديد من أجل التوفيق بين 
عائلة وأحد الأطفال» استطاعوا اتخاذ قرارات خاصة بالتوفيق أفضلء مما أدى إلى ارتفاع 
نسبة الأطفال الذين يحصلون على منزل دائم. 

وتمثل هذه الحالة القصيرة مثالًا واحدًا من العديد من الأمثلة التي تستخدم جداول 
البيانات كأداة لدعم القرارء حيث يتم إنشاء نظام مطابقة أفضل بين رغبات العائلة 
التي ترغب في التبنّي وسمات الطفلء من خلال إنشاء نظام تسجيل بسيط لرغبة العائلة 
وسمة الطفل بحيث يتم الإبلاغ عن عدد أقل من حالات الرفض لأي من الجانبين. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oor‏ 


الفصل السادس 


أسئلة للمناقشة: 
-١‏ ما هي التحديات التي واجهتها 247 أثناء اتخاذ قرارات توفيق حالات التبنّي؟ 
۲- ما هي مميزات أداة جدول البيانات الجديدة التي ساعدت 288 في حل المشاكل 
التي تتعلق بالتوفيق بين عائلة وطفل؟ 
Source: Adapted from Slaugh, V. W., Akan, M., Kesten, O., & Unver, M. U. (2016).‏ 


The Pennsylvania Adoption Exchange improves its matching process. Interfaces, 
46(2), 133154-. 


حالة عملية 0-5 
استخدام مؤسسة مترو ميلز أون وبيلز تريجر فالي 
aliy (Metro Meals on Wheels Treasure Valley)‏ 81 من أجل البحث 
عن خطوط السير الُثلى للتسليم 

Meals on Wheels Association of America‏ (وتسمى الآن 
ag (Meals on Wheels America‏ منظمة غير ربحية تقوم بتقديم 
ما يقرب من مليون وجبة إلى منازل كبار السن المحتاجين عبر الولايات 
المتحدة. Lla L$ ô Metro Meals on Wheels Treasure Valley oig‏ 
(Idaho) gsl] à Jas Meals on Wheels America J‏ حیث يحتوي هذا 
الفرع على فريق من السائقين المتطوعين الذين يستخدمون سياراتهم الشخصية 
كل يوم من أجل تقديم الوجبات إلى 4٠١‏ عميل على طول ١؟‏ مسارًا ويغطون 
مساحة تبلغ 1140 كيلومتر مربع. 

وقد واجهت مn¦¡iة Meals on Wheels Treasure Valley‏ العدید من 
امشاكل. أآما المشكلة الأولى» فقد تمثلت في تطلعهم إلى تقليل وقت التسليم حيث 
كان الطعام المطبوخ حساسًا لدرجة الحرارة ومن الممكن أن يفسد بسهولة. وقد 
كانوا يرغبون في توصيل الطعام المطبوخ في غضون 5١‏ دقيقة من بعد مغادرة 
السائق من أجل توصيل الطعام. وأما المشكلة الثانية. فقد تمثلت في استغراق 
Lig gsal ilas‏ طويلًا جدًا. وقد قضى اثنان من الموظفين الكثير من وقتهم 
في تطوير مسارات مجدولة من أجل التوصيل. وقد قدم منسق خطوط السير 
بتحديد عدد مرات التوقف وفقًا لعدد متلقي الوجبات ليوم معين. وبعد تحديد 
نقاط التوقفء قام المنسق بعمل سلسلة من التوقفات التي قللت من وقت 


oot‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


سفر المتطوعين. وبعد ذلك يتم إدخال جدول خط السير في أداة عبر الإنترنت 
لتحويل تعليمات القيادة للسائقين. وقد كانت عملية تحديد خطوط السير يدويًا 
تستغرق الكثير من الوقت الإضافي. وتحتاج 2131517 إلى أداة تمكنها من تحسين 
نظام التوصيل الخاص بهم فضلا عن قدرتها على تقديم حلول توجيه لكل من 
اتجاهات الذهاب والعودة لتوصيل وجبات الطعام. ويمكن لأولئك الذين يقودون 
بانتظام أن يقوموا بتوصيل الطعام الدافن أو البارد في اليوم التالي. أما الأشخاص 
الآخرون الذين يقومون بقيادة السيارات فقط في بعض الأحيانء فإنهم يحتاجون 
إلى العودة إلى المطبخ أحيانًا لتوصيل الأطعمة الدافئة / المبردة. 
المنهجية / الحل: 

تم تطوير أداة تعتمد على جدول البيانات» من أجل حل مشكلة خط السير. 
حيث تحتوي هذه الأداة على واجهة لإدخال المعلومات الخاصة بالمستلم بسهولة 
مثل اسمه / اسمها ومتطلبات الوجبة» وعنوان التسليم» حيث ينبغي ملء هذه 
المعلومات في جدول البيانات لكل نقطة توقف في خط السيرء ثم بعد ذلك تم 
استخدام برنامج عأقة8 1715131 5]ء»<8 لوظيفة التطبيقات من أجل الوصول إلى 
واجهة برمجة تطبيقات خرائط الشبكة للمطورين „MapQuest pas ilg (APT)‏ 
وقد تم استخدام هذه الواجهة الخاصة ببرمجة التطبيقات 481 لإنشاء مصفوفة 
سفر تقوم بحساب الوقت والمسافة اللازمة لتوصيل url‏ حيث تعطي هذه الأداة 
معلومات عن الوقت والمسافة ل٠٠٠٠‏ زوج من المواقع يوميًا بدون أي تكلفة. 

وعند بدء التشغیل يقوم MapQuest API‏ أولًا بالتأكد من صحة العناوين 
المدخلة لمتلقي الوجبات. ثم يستخدم البرنامج واجهة برمجة التطبيقات (421) 
للحصول على مسافة القيادةء والوقت المتوقع للقيادة» وتغيير التعليمات للقيادة 
بين جميع نقاط التوقف في الطريق. وبعد ذلك. تستطيع الأداة الوصول إلى ٠٠١‏ 
محطة خلال فترة زمنية ممكنة. 
النتائج / الفوائد: 

أدى استخدام هذه الأداة» إلى انخفاض إجمالي مسافة القيادة السنوية بمقدار 
ميلء بينما قل وقت السفر بمقدار 01١‏ ساعة. وقد وفرت وجبات Metro‏ 
à $0,۸۰۰ Meals on Wheels Treasure Valley‏ عام BERAR)‏ على معدل 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 000 


الفصل السادس 


توفير يقدر ب 80,08 (لكل سيارة سيدان متوسطة الحجم). كما استطاعت هذه 

الأداة تقليل الوقت المستغرق في تخطيط خط السير لتوصيل الوجبات. كما تضمنت 

المزايا الأخرى زيادة رضا المتطوعين بالإضافة إلى زيادة فرص الاحتفاظ بهم. 

أسئلة للمناقشة: 

-١‏ ما هي التحديات المتعلقة بتوصيل الوجبة التي واجهت 
Metro Meals on Wheels Treasure Valley related‏ قبل اعتماد الأداة 
المستندة إلى جدول البيانات؟ 

۲- وضح تصميم نموذج يستند إلى جدول البيانات. 

Metro Meals on Wheels lle ما هي الفوائد غير املموسة التي حصلت‎ -Y 
SExcel بسبب استخدام نموذج يستند إلى‎ 


Source: Adapted from Manikas, A. S., Kroes, J. R., & Gattiker, T. F. (2016). Metro 
Meals on Wheels Treasure Valley employs a low- cost routing tool to improve 
deliveries. Interfaces, 46(2), 154167-. 


تنطوي ال مميزات المهمة الأخرى لجدول البيانات على تحليلات ”ماذا - لو“ والبحث عن 
الهدفء بالإضافة إلى إدارة البيانات» وقابلية البرمجة (أي وحدات الماكرو). ويمكن بسهولة تغيير 
قيمة الخلية والاطلاع فورًا على النتيجةء باستخدام جدول البيانات. كما يتم تنفيذ البحث عن 
الهدف من خلال الإشارة إلى خلية الهدف والقيمة المطلوبة والخلية المتغيرة. ويمكن تنفيذ إدارة 
قاعدة بيانات واسعة مع مجموعات بيانات صغيرة أو أجزاء من قاعدة بيانات يمكن استيرادها 
للتحليل (والذي هو في الأساس كيفية عمل 014۴ مع مكعبات البيانات متعددة الأبعاد. وفي 
الواقع» فإن معظم أنظمة 0147 لديها الشكل والمظهر من برامج جداول البيانات المتقدمة بعد 
(OUI Joss‏ وتقوم قوالب ووحدات الماكرو والأدوات الأخرى بتعزيز إنتاجية بناء 255. 

ونظرًا لأن حزم جداول البيانات تقرأ وتكتب بنى ملفات شائعة وتتفاعل بسهولة مع قواعد 
البيانات والأدوات الأخرى؛ فإن معظمها يوفر تكاملًا سلسًا إلى حد suus Sola ass la‏ إكسل 
هي حزمة جدول البيانات الأكثر انتشارًا. وفي الشكل »)١-5(‏ نقوم بعرض نموذج حساب قرض 
بسيط حيث تصف المربعات في جدول البيانات محتويات الخلاياء والتي تحتوي على صيغ؛ حيث 
يظهر تغيير في معدل الفائدة في الخلية ۴۷ على الفور في الدفع الشهري في الخلية .51١‏ ومن 
اممكن ملاحظة النتائج وتحليلها على الفور. فإذا كنا بحاجة إلى دفعة شهرية محددة, فيمكننا 
استخدام البحث عن الهدف بغرض تحديد سعر فائدة مناسب أو مبلغ قرض. 


061 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


الجدير بالذكر أن جدول الحسابات الموضح في الشكل (1-؟) ثابت. وعلى الرغم من تأثير 
المشكلة على المقترض بمرور الوقتء إلا أن النموذج يشير إلى أداء شهر واحدء والذي يتم تكراره. 
وعلى النقيضء فإن النموذج الحري يمثل السلوك بمرور الوقت. كما تشير حسابات القروض في 
جدول البيانات الموضحة في الشكل (2-1) إلى تأثير الدفع المسبق على المبلغ الأصلي بمرور الوقت. 
وباستخدام مولدات رقمية عشوائية مدمجة لتطوير نماذج المحاكاة» يمكن دمج تحليل الخطر في 
جداول البيانات (انظر الفصل التالي). 


^ > 8 > ٤ ۴ 6 3 
x 
a 
` Simple Loan Calculation Model in Excel 
4 
s 
s Laan Amore $150,000. 
2 ioterest aste s0x 
. Number of Year 3 
0 2 
6] Number of Mentha 








0 * € > 3 ۴ s * 1 * 
3 

` جوع صما لصتيو‎ Marti mt Pepe i nat 

` 

` 

e taan arnet لععما‎ 

, — سه‎ ame 

1 — — » 

5 ara] 

» anter ef Mr 

u eam. [5 

2 ETE 

Oo سسا‎ aa [mazî |] 


rni prota yn Mes Feel d a Sen iios 





Staa. 
5120048. 
Sias 
5120648. 








شكل 6-5: مثال نموذج ديناميي لجداول بيانات 851 لحساب قرض بسيط بمدفوعات شهرية 
وتأثيرات الدفع ا مسبق 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oov‏ 











الفصل السادس 


ويتم الإبلاغ عن تطبيقات جداول البيانات للنماذج بانتظام. وفي القسم التالي سوف نتعلم 
كيفية استخدام نموذج تحسين يعتمد على جدول البيانات. 


أسئلة مراجعة على القسم "-0: 
-١‏ ما هو جدول البيانات؟ 
۲- ماذا أضاف جدول البيانات؟ وكيف تساعد هذه الإضافة في إنشاء واستخدام DSS‏ 
e 3 - — >‏ 
۳- اشرح اذا یؤدی جدول البیانات إلى تطوير نظام DSS‏ 
شرح ماذا يؤدي ج بيانات ! e‏ 


7-5 تحسين البرمجة الرياضية: 

إن البرمجة الرياضية هي مجموعة من الأدوات التي صّممت من أجل المساعدة في حل 
المشاكل الإدارية والتي ينبغي أن يقوم فيها صانع القرار بتخصيص موارد نادرة بين الأنشطة 
ا متنافسة من أجل تحسين هدف قابل للقياس. فعلى سبيل المثال. يعتبر توزيع وقت الماكينة 
(المورد) بين المنتجات المختلفة (الأنشطة) مشكلة تخصيص نموذجية. وتُعد البرمجة الخطية 
(1آ) أفضل تقنية معروفة في عائلة أدوات التحسين والتي تسمى البرمجة الرياضية؛ حيث 
تكون كافة العلاقات بين المتغيرات خطية في S LP‏ يتم استخدامه على نطاق واسع في نظام 
الترصد الدهوغراف (انظر الحالة العملية 1-1). وتتميز نماذج البرمجة الخطية بأن لديها العديد 
من التطبيقات المهمة في الممارسة. وتتضمن هذه التطبيقات إدارة سلسلة التوريد: وقرارات 
مزج ال منتجات» والتوجيه؛ وغير ذلك. ومن ال ممكن استخدام أشكال خاصة من النماذج لأجل 
تطبيقات محددة. فعلى سبيل المثال. تصف الحالة العملية (5-1) نموذج جدول البيانات الذي 
تم استخدامه لإنشاء جدول زمني للأطباء. 


حالة عملية 5-5 
مساعدة موذج البرمجة العددية المختلطة مركز جامعة تينيسي ("JI (Tennessee)‏ 
في وضع جدول مواعيد الأطباء 
إن مؤسسة الأطفال حديثي الولادة الإقليمية Regional Neonatal Associates‏ ھي 
عبارة عن مجموعة تضم تسعة أطباء يعملون في وحدة العناية المركزة لحديثي الولادة 
jS å (NICU)‏ الطبي لجامعة تينيسي (Tennessee)‏ في (Knoxville) Lå uS‏ 
تينيسي (160265566). كما تخدم المجموعة أيضًا اثنتين من المستشفيات المحلية في 


^00 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


منطقة نوكس فيل (12201116) لأغراض الطوارئ. ولعدة سنوات» يقوم عضو واحد في 
امجموعة بوضع جدول مواعيد الأطباء يدويًا لعدة سنواتء بيد أنه. مع اقتراب تقاعده. 
كانت هناك حاجة إلى نظام أكثر تلقائية لوضع جدول مواعيد الأطباء. وقد رغب الأطباء 
في أن يكون هذا النظام قادرًا على موازنة عبء العمل الخاص بهم. حيث م تستطع 
الجداول السابقة موازنة عبء العمل بينهم بشكل مناسب. وبالإضافة إلى ذلك OB‏ 
الجدول الزمني يحتاج لضمان تواجد الأطباء ۲١‏ ساعة ۷ أيام في الأسبوع لتغطية وحدة 
العناية المركزة لحديثي الولادة N1٥07‏ من قبل الأطباء» وإذا أمكنء يقوم هذا النظام 
باستيعاب التفضيلات الفردية للأطباء لأنواع التناوب. وممعالجة هذه المشكلةء قام 
الأطباء بالاتصال بكلية العلوم الإدارية في جامعة تينيسي (Tennessee)‏ 

وقد تميزت مشكلة جدولة مواعيد الأطباء إلى نوبات بأنها كانت تقوم على أساس 
قيود عبء العمل وخيارات نمط الحياة. وقد تمثلت الخطوة الأولى لحل مشكلة في 
الجدولة وهي تجميع النوبات وفقًا لأنواعها (ليلًا ونهارًا). أما الخطوة التالية فقد تمثلت 
في تحديد قيود المشكلة. ويحتاج النموذج لتغطية فترة تسعة أسابيع بتسعة أطباء. 
مع اثنين من الأطباء يعملون طوال أيام الأسبوع وطبيب واحد لَيِْي وفي عطلات نهاية 
الأسبوع» بالإضافة إلى ضرورة تعيين طبيب واحد فقط لتغطية ۲٤‏ ساعة يوميًا لسبعة 
أيام في الأسبوع للمستشفيّين المحليّين. كما تحتاج القيود الواضحة الأخرى أيضًا إلى النظر 
فيها. فعلى سبيل المثالء لا يمكن تكليف طبيب بوردية نهارية بعد قضائه لوردية ليلية. 

المنهجية / الحل: 

تم صياغة المشكلة من خلال إنشاء نموذج تحسين عددي مختلط. وقد قسم 
النموذج الأول حجم العمل بين تسعة أطباء بالتساوي. غير أن هذا النموذج لم يستطع 
أن يحدد عددًا متساويًا من النوبات الليلية والنهارية بين الأطباء.. وقد نشأ عن ذلك 
مسألة التوزيع العادل. وبالإضافة إلى ذلك فقد كان للأطباء آراء مختلفة حول عبء 
العمل المحدد. وقد أراد ستة أطباء وضع جدول زمني يتم فيه تعيين عددٍ متساوٍ من 
النوبات النهارية والليلية لكل طبيب في الجدول الزمني الذي يستغرق تسعة أسابيع: في 
حين يرغب الآخرون بوضع جدول زمني بناءً على تفضيل كل فرد من الأطباء للنوبات. 
ومن أجل ذلك تم تشكيل نموذج جديد يمكنه تلبية متطلبات كلا الفريقين من الأطباء 
وسُّمي هذا النموذج بنموذج جدولة التفضيلات المختلطة (51552/1). ومن أجل تلبية 
متطلبات المساواة للستة أطباء الذين رغبوا في ذلكء قام النموذج أولًا بحساب حجم 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 004 


الفصل السادس 


العمل لمدة أسبوع واحد ثم قسمه لمدة تسعة أسابيع بالنسبة لهم. وبهذه الطريقة. 
استطاع تقسيم العمل بالتساوي بين جميع الأطباء الستةء ثم قام بتقسيم عبء العمل 
للثلاثة أطباء المتبقين في الجدول الزمني لمدة تسعة أسابيع وفقًا لتفضيلاتهم. ومن ثم 
قام الأطباء مراجعة الجدول الزمني الناتج فوجدوه أكثر قبولا. 
النتائج / الفوائد: 
استطاعت طريقة جدولة التفضيلات ال مختلطة 1۴5M‏ أن تستوعب كلا من متطلبات 
المساواة ومتطلبات الأفضلية الفردية للأطباء. وبالإضافة إلى ذلك فقد تمكّنت الجداول 
من هذا النموذج من تقديم أوقات راحة أفضل للأطباء مقارنةٌ بالجداول الزمنية السابقة, 
فضلًا عن إمكانية تلبية طلبات الإجازات في الجداول. كما يستطيع نموذج 112521 حل 
مشاكل الجدولة المشابهة التي تتطلب التفضيلات النسبية بين أنواع النوبات. 
وتستطيع بعض التقنيات من مثل نماذج البرمجة العددية المختلطة أن تقوم بإنشاء 
الجداول الى فضأ عن قدرتها على المساعدة في العمليات. وقد تم استخدام هذه 
التقنيات في المؤسسات الكبيرة لفترة طويلة. والآن يمكن تنفيذ مثل هذه النماذج التحليلية 
التوضيحية في جداول البيانات وغيرها من البرامج المتاحة بسهولة. 
أسئلة للمناقشة: 
-١‏ ما هي المشكلة التي واجهت مؤسسة الأطفال حديثي الولادة الإقليمية؟ 
۲- كيف استطاع نموذج 1۲5M‏ تلبية جميع متطلبات الأطباء؟ 
Source: Adapted from Bowers, M. R., Noon, C. E., Wu, W., & Bass, J. K. (2016).‏ 
Neonatal physician scheduling at the University of Tennessee Medical Center.‏ 
Interfaces, 46(2), 168182-.‏ 
baleg‏ ما تُظهر مشاكل توزيع البرمجة الخطية المميزات التالية: 
- هناك كمية محدودة من الموارد الاقتصادية متاحة للتخصيص. 
- تُستخدم الموارد في إنتاج المنتجات أو الخدمات. 
- يوجد طريقتان أو أكثر يمكن من خلالها استخدام الموارد. ويسمى كل منها حل أو برنامج. 
- ينتج عن كل نشاط (منتج أو خدمة) والذي يتم استخدام الموارد فيهء عائدًا على الشروط 
الخاصة بالهدف المعلن. 
ole -‏ ما يكون التخصيص مقيدًا بعدة قيود ومتطلبات. تسمى القيود. 


ow‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


ويعتمد نموذج تخصيص البرمجة الخطية على الافتراضات الاقتصادية العقلانية التالية: 

- يمكن مقارنة العوائد من التخصيصات المختلفة؛ بمعنى أنه يمكن قياسها بوحدة مشتركة (مثل: 
الدولارء والفائدة). 

- العائد من أي تخصيص يكون مستقلًا عن التوزيعات الأخرى. 
- إجمالي العائد هو مجموع العوائد الناتجة عن الأنشطة المختلفة. 
- جميع البيانات معروفة على وجه التأكد. 
- استخدام الموارد بطريقة أكثر اقتصادًا. 

وعادةً ما تتضمن مشالل التخصيص عددًا كبيراا من الحلول الممكنة. واعتمادًا على الافتراضات 
الأساسيةء فإن عدد الحلول قد يكون لا نهائي وقد يكون محدودًاء وعادةً ما تنتج الحلول امختلفة 
مكافآت مختلفة. ومن بين الحلول ال متاحة يوجد على الأقل حل واحد يعتبر هو الأفضل؛ بمعنى أن 
درجة تحقيق الأهداف المرتبطة به هي الأعلى (آي إن إجمالي المكافأة هو الحد الأقصى)ء وهذا ما 
يسمى الحل الأمثلء ويمكن العثور عليه باستخدام خوارزمية خاصة. 
نموذج البرمجة الخطّية: 

يتكون كل نموذج برمجة خطية 1.7 من متغيرات القرار (والتي تكون قيمتها غير معروفة 
ويتم البحث عنها)» ودالة موضوعية (دالة حسابية خطية تربط متغيرات القرار بالهدفء كما 
تأخذ المعايير اللازمة لتحقق الأهدافء وكيفية تحسينها). ومعاملات دالة الهدف (وحدة الربح أو 
معاملات التكلفة التي تشير إلى إسهام هدف وحدة واحدة من متغير القرار). بالإضافة إلى القيود 
(المعبر عنها في شكل عدم مساواة خطية أو مساواة تحد من الموارد و / أو المتطلبات؛ والتي 
تقوم بربط المتغيرات من خلال العلاقات الخطية)» والقدرات (والتي تصف الحدود العليا وأحيانًا 
الحدود الدنيا حسب القيود والمتغيرات)» ومعاملات المدخلات / المخرجات (التقنية) (والتى تشير 
إلى استخدام الموارد من أجل متغير القرار). í‏ 

دعونا نتأمل هذا المثال: تحتاج شركة MBI‏ التي تقوم بصنع أجهزة حاسب لأغراض خاصة 
إلى اتخاذ قرار بخصوص: كمْ عدد أجهزة الحاسب التي ينبغي إنتاجها الشهر المُقبل في مصنع 
بوسطن؟ حيث تدرس 2181 نوعين من أجهزة الحاسب: CC-7‏ والتي تتطلب ٠٠٠١‏ يوم من 
العمل و١٠٠٠٠5‏ للخامات. و00-8©) والتي تتطلب ٥٠١‏ يوم عمل و٠٠٠,٥$1‏ للخامات. وتبلغ 
قيمة المساهمة الربحية لكل جهاز 8٠,٠٠١۸ C٣-7‏ في حين تبلغ المساهمة الربحية لكل جهاز 
.,٠٠١ 00-8‏ وتبلغ سعة المصنع ٠٠٠,٠٠١‏ يوم عمل في الشهرء كما تبلغ امميزانية المادية ۸ 
مليون دولار شهريًا. ويتطلب التسويق إنتاج ٠٠١‏ وحدة من 00-7 على الأقل بالإضافة إلى ما لا 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 


الفصل السادس 


يقل عن ٠٠١‏ وحدة من 00-8 كل شهر. وتكمن المشكلة في زيادة أرباح الشركة إلى أقصى حد 
من خلال تحديد عدد وحدات 00-7 وعدد وحدات 00-8 التى ينبغى إنتاجها كل شهر. لاحظ 
أن هذا الأمر قد يستغرق شهورًا للحصول على بيانات dius al is‏ في البيئة الواقعية» وأثناء 
جمع البيانات سيكشف صانع القرار بلا شك الحقائق حول كيفية هيكلة النموذج المطلوب حله. 
رؤية فنية 1-5: البرمجة الخطّية 
ربما تكون البرمجة الخطية 1.5 هي نموذج التحسين الأكثر شهرة؛ حيث يتعامل هذا 
النموذج مع التخصيص الأمثل للموارد بين الأنشطة المتنافسة. وقد تم توضيح مشكلة 
التخصيص من خلال النموذج الموضح هنا. 
وتكمن المشكلة في العثور على قيم متغيرات القرار س١‏ وس"؟ وغيرهاء بهدف وصول 
قيمة متغير النتيجة 7 إلى أقصى حد ممكنء مع مراعاة مجموعة من القيود الخطية التي 
تعبر عن كل من il‏ وظروف السوقه بالإضافة إلى المتغيرات الأخرى التي لا يمكن 
التحكم فيها. أما العلاقات الرياضية فهي كل المعادلات الخطية بالإضافة إلى التباين. 
ومن الناحية النظريةء فإن أي مشكلة تخصيص من هذا النوع لديها العديد من الحلول 
ال ممكنة التي لا حصر لها. فمن خلال استخدام إجراءات رياضية خاصة: يطبق منهج 
البرمجة الخطية 1.2 إجراء بحث فريد يتم تنفيذها بواسطة الحاسب حيث هكنه إيجاد 
أفضل حل (حلول) في غضون ثوان» فضلًا عن قدرته على توفير تحليل الحساسية التلقائي. 
النمذجة في البرمجة الخطَّية 1.0 مثال: 
يمكن تطوير نموذج برمجة خطية «:1آ قياسي لمشكلة شركة MPI‏ التي ذكرناها آنقًا. وكما 
ناقشنا في الفكرة التقنية »)١-1(‏ فإن نموذج البرمجة الخطية 1 يحتوي على ثلاثة مكونات» وهي: 
متغيرات القرارء ومتغيرات النتائج. والمتغيرات التي لا يمكن التحكم فيها (القيود). 
حيث تكون متغيرات القرار كما يلي: 


[X = units of CC — 7 to be produced | 
X; — units of CC — 8 to be produced | 


ويكون متغير النتيجة كما يلي: 
Total profit = Z |‏ 


ow‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التوجيهية: التحسين والمحاكاة 


والهدف هو الوصول بالربح الإجمالي إلى أقصى حد ممكن: 
Z = 8,000X, + 12,0003‏ 








وتكون المتغيرات (القيود) التي لا يمكن التحكم فيها كما يلي: 


Labor constraint: 300X + 500X = 200,000 (in days) 








Budget constraint: 10,000X, + 15,0003 = 8,000,000 (in dollars) 
Marketing requirement for CC — 7: X 7 100 (in units) 
Marketing requirement for CC — 8: X; 2 200 (in units) 








ويلخص الشكل (0-7) هذه المعلومات. 


X, = units of CC7 (Q5) 2 تعظيم‎ Z= l إجمالى‎ 
X, = units of CC-8 تخضع لقيود‎ Z= 8,000x,+12,000x, 
1 


300X, + 500X, < 200,000 


10,0001, + 15,0000, > 0 
X, 2100 
X, 2 200 








شكل 0-5: نموذج رياضي مثال مزيج المنتج 

وبالإضافة إلى المكونات التي كرت سابقاه فإن النموذج يحتوي أيضًا على مكون رابع خفي؛ حيث 
يحتوي كل نموذج برمجة خطية 1۴ على بعض المتغيرات الوسيطة الداخلية والتي لم تذكر بشكل صريح. 
فعندما يكون الجانب الأيسر أقل دقة من الجانب الأمنء فإن كلا من قيود العمل وام ميزانية قد تسبب 
حدوث بعض الركود بهم. هذا الركود يتم تمثيله داخليًا عن طريق متغيرات الركود التي تشير إلى وجود 
موارد زائدة متاحة. أما عندما يكون الجانب الأيسر ذا دقة أكبر من الجانب الأمن فإن قيود متطلبات 
التسويق قد يكون لدى كل منها بعض الفائض» ويتم تمثيل هذا الفائض داخليًا بواسطة المتغيرات 
الفائضة مما يدل على وجود بعض المساحة التي تتيح ضبط الجوانب اليمنى من هذه القيود. وثعد كل 
من متغيرات الركود والفوائض متوسطة» كما أنها قد تكون ذات قيمة كبيرة لصانع القرار نظرًا لاستخدام 
طرق حل النماذج الخطية 1.5 لها في وضع مَعْلَمات الحساسية لتحليلات ”ماذا - لو“ الاقتصادية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 





























الفصل السادس 


ويحتوي نموذج المزيج التسويقي على عدد لا نهائي من الحلول الممكنة. فإذا افترضنا أن خطة 
الإنتاج لا تقتصر على الأعداد الصحيحة - وهو افتراض معقول في خطة الإنتاج الشهرية - فإننا نريد 
حلًا يصل بإجمالي الربح إلى أقصى حد ممكن: ألا وهو الحل الأمثل. ولحسن الحظ يظهر برنامج 5:01 
مع الأداة الإضافية :50176, والتي يمكنها الحصول بسهولة على الحل الأمثل (الأفضل) لهذه المشكلة. 
وعلى الرغم من نقل موقع الوظيفة الإضافية 501765 من أحد الإصدارات إلى إصدار آخرء غير أنه 
مازال متاحًا كوظيفة إضافية مجانية» ويمكنك البحث عنه ضمن علامات تبويب البيانات وعلى شريط 
التحليل. فإنه يمكن تفعيله من خلال الانتقال إلى قائمة الخيارات في 8:61 وتحديد الوظائف الإضافية. 

ونقوم بإدخال هذه البیانات مباشرة فی جدول بیانات 8×٤1‏ ثم نعمل Solver h ås de‏ 
e$ as‏ نقوم بتحديد الهدف (من خلال وضع الخلية المستهدفة تساوي الحد الأقصى)» بالإضافة إلى 
متغيرات القرار (عن طريق الإعداد بواسطة تغيير الخلايا)» والقيود (من خلال التأكد من أن إجمالي 
العناصر المستهلكة أقل من أو يساوي الصقَّين ASII‏ ويكون أكبر من أو يساوي كلا الصفين الثالث 
والرابع). وتشكل كل من الخلايا 7© و17 خلايا متغير القرار. وبعد تشغيل الوظيفة الإضافية :50156 
سيتم ملء النتائج في هذه الخلايا؛ حيث 137 هي الخلية المستهدفة؛ والتي تعد أيضًا المتغير الناتج» كما 
أنها تمثل منتجًا من خلايا متغير القرار ومعاملات الربح لكل وحدة (في الخلايا 8© و08). لاحظ أنه تم 
قسمة جميع الأرقام على ٠٠٠١‏ لجعل كتابتها أسهل (باستثناء متغيرات القرار). وتصف الصفوف من 
؟ إلى ١١‏ قيود المشكلة: القيود على قدرة اليد العاملةء وعلى ال ميزانيةء بالإضافة إلى القيود على الحد 
الأدنى المطلوب لإنتاج المنتجين ,]1 و .×٫‏ ويحدد كلا العمودين ٤‏ و0 معاملات هذه القيود. وينطوي 
العمود 15 على الصيغ التي تضاعف متغيرات القرار (خلايا ٥7‏ و57) مع معاملات كل منهما في كل 
صف. أما القيمة الجانبية لهذه القيود فيحددها العمود ۴. ولتطوير مضاعفات الصفوف والأعمدة 
بسهولة» فإنه هكن استخدام إمكانيات مصفوفة إكسل (على سبيل .(SUMPRODUCT ةlI «Jll‏ 
وبعد إعداد حسابات النموذج ف 8×61 فإن هذا هو الوقت المناسب لاستدعاء الوظيفة الإضافية 
6. ويؤدي النقر فوق الوظيفة الإضافية ل 501761 (مرة أخرى ضمن مجموعة 481/515 ضمن 
علامة تبويب البيانات) إلى فتح مربع حوار (إطار) يتيح لك تحديد الخلايا أو النطاقات التي تحدد 
خلية دالة الهدف ومتغيرات القرار / التغيير (الخلايا) والقيود. كما نقوم أيضًا باختيار طريقة الحل من 
الاختيارات (عادةً البرمجة الخطية البسيطة (LP‏ ومن تم نقوم بحل المشكلة. وبعد ذلك نقوم باختيار 
التقارير الثلاثة - الإجابة والحساسية والقيود - للحصول على الحل الأمثل من 55.066.667 - الربح» 
0 = ر 333.33 - ,ك2 كما يتضح من الشكل (1-7). حيث تنتج 501966 ثلاثة تقارير مفيدة حول 
الحل. يمكنك القيام بتجربتها. وقد أصبح الآن:50176 ذا قدرة على حل مشاكل البرمجة غير الخطية 
ومشاكل البرمجة الصحيحة باستخدام أساليب الحل الأخرى المتوفرة به. 


nn‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 











Excel (jo Solver J2J Js. 1-3 JS‏ مزيج المنتجات 
وفيما يلي مثال لتوضيح مدى قوة نمذجة جداول بيانات دعم القرارء وقد تم وضع هذا المثال 
من قبل البروفيسور 11711505 1811 من جامعة أوكلاهوما الحكومية. 











A 5 
e 
1 
3 
4 n 
5 n 
5 n 
, n 
s n 
, n 
w n 
u n 
n| 1 
nm 
4 n s 
a Men 4 
te Women * 
7 U 0 Taa 
u 
n n Oi 
» M 4 
21 Women as 
n a ?5 Tecal 
n 
u n 
E Men s 
26 Women. s 
n 35 as . Tes 

um 


شكل 5-/: مثال لبيانات توزيع موارد الانتخابات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oro‏ 














الفصل السادس 


حيث يصف الجدول الوارد في الشكل (1-/) بعض البيانات الافتراضية وسمات تسع «ولايات 
متقلبة» لانتخابات عام .7١17‏ حيث تشمل سمات التسع ولايات مَن كان عددهم من الأصوات 
الانتخابيةء واثنتين من الواصفات الإقليمية (لاحظ أن هناك ثلاث ولايات تصنّف على أنها ليست 
شمالية ولا جنوبية). فضلًا عن ”وظيفة التأثير“ المقدرة والتي تتعلق بزيادة دعم المرشح لكل 
وحدة من حملات الاستثمار المالي في تلك الحالة. فعلى سبيل اممثالء ثبين دالة التأثير 51 أنه 
سيكون هناك زيادة إجمالية قدرها ٠١‏ وحدات في دعم الناخبين (تظل الوحدات العامة هنا كما 
هي عامة) بالنسبة لكل وحدة مالية مستثمرة في تلك الولاية» كما تتكون من زيادة في دعم الشباب 
مقدار ثلاث وحدات» ودعم كبار السن من الرجال مقدار وحدة واحدةء والنساء صغار السن 
والمسنات بمقدار ۲ وحدات لكل منهم. 

وتضم الحملة ٠١6١‏ وحدة مالية للاستثمار في الولايات التسع؛ حيث ينبغي ألا يقل نصيب كل 
ولاية من الاستشمار عن 0> من إجمالي الاستثمارات الكلية» كما ينبغي ألا يزيد عن /* من إجمالي 
الاستثمارات المستثمرة في أي من الولايات. ولا يلزم استثمار جميع الوحدات البالغ عددها ٠١6١‏ 
وحدة (ينبغي أن يتعامل النموذج الخاص بك مع هذا بشكل صحيح). 

أيضًاء فإن الحملة لديها بعض القيود الأخرى. ومن وجهة نظر الاستثمار المالي» فإنه ينبغي أن 
يكون لدى الولايات الغربية (إجمالًا) استثمارات في الحملات مستوى لا يقل عن >1١‏ من إجمالي 
المستثّمر في الولايات الشرقية. أما من حيث الأشخاص المتأثرين» فإنه ينبغي أن يؤدي قرار تخصيص 
الاستثمارات المالية للولايات إلى مالا يقل عن 91٠١‏ من إجمالي ا متأثرين. وبشكل عام فإنه ينبغي 
أن يكون العدد الإجمالي للإناث المتأثرين أكبر من أو يساوي العدد الإجمالي للذكور المتأثرين, 
بالإضافة إلى أنه يجب أن يكون 61* على الأقل من مجموع الأشخاص المتأثرين من «المسنين». 

وتتمثل مهمتنا في إنشاء نموذج برمجة صحيح مناسب يحدد العدد الصحيح الأمثل (أي 
العدد الكامل) للوحدات المالية الخاصة بالولايات والتي ترفع من مجموع منتجات وحدات 
التصويت الانتخابيةء التي يتم استثمارها تبعًا للقيود الأخرى المذكورة آنقًا إلى أقصى حد ممكن. 
(وهكذاء وبشكل غير مباشرء فإن هذا النموذج يفضل الولايات التي تتمتع بعدد كبير من الأصوات 
الانتخابية). لاحظ أنه يجب أن تؤدي جميع القرارات الخاصة بالتخصيص في النموذج إلى قيم 
صحيحة» حتى يستطيع موظفو الحملة التنفيذ بسهولة. 

واعتمادًا على الأسئلة التالية التي يجيبون عنهاء هكن تصنيف الجوانب الثلاثة الخاصة 
بالنماذج» وتتمثل هذه الأسئلة في: 


03 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


Nevada lolis ماالذي نتحكم فيه؟ المبلغ المستثمر في الإعلانات عبر التسع ولايات»‎ -١ 
وفرجينيا‎ Ohio 5555 Wisconsin 5 255$:533 dowa وأيوا‎ «Colorado 53155 Js55 
ونيو هامبشاير‎ cFlorida l5 55185 :North Carolina L.Js jS 555 |J! 1ع بالإضافة‎ 
WI OH5 JAg CO9 NV والتي تُثلها متغيرات القرار التسعة:‎ New Hampshire 
-NH بالإضافة إلى‎ FLg NC9 «VA 

-١‏ ماذا نريد أن نحقق؟ نريد تحقيق أقحى زيادة ممكنة للعدد الإجمالي لمحكسب الأصوات 
الانتخابية. فنحن على دراية بقيمة كل صوت انتخابي في كل ولاية (877). حيث يعادل هذا 
الصوت الانتخابي *817 الاستثمارات المجمعة للولايات التسع. أي: 


| Max (GNV + 9CO + 61A + 10W1 + 18OH + 13VA + 15NC + 29FL+ 4NH)| 


-Y‏ ما الذي يقيدنا؟ 
وفيما يلي القيود كما دُكرت في وصف المشكلة: 
( أ ) مالا يزيد عن ٠,٠٠١‏ وحدة مالية للاستثمار فيهاء أي: 
.NV + CO + IA + WI + OH + VA + NC + FL + NH < = 1,050‏ 
(ب) استثمار >٥‏ على الأقل من الإجمالي قي كل ولايةء أي: 


NV > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
CO > = 0,05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
IA > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
WI > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
OH > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
VA > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
NC > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
FL» = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
NH > =0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 





ويمكننا تنفيذ هذه القيود التسع بعدة طرق عن طريق استخدام [8:<06. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 














الفصل السادس 


(ج) لا يزيد الاستثمار عن <٠١‏ من الإجمالي قي كل ولاية. 
وكما هو الحال في (ب)» فإننا نحتاج مرة أخرى إلى تسع قيود فردية لأننا لا نعرف كم 
من ٠,۰٥١‏ سوف نستثمر. كما يجب أن تكون القيود بعبارات «عامة». 


NV < = 0.25 (NV + CO + IA + WI + 011 + الي ولا‎ + FL + NH) 
CO <= 0.25 (NV + CO + 1A + WI + OH EÊ + NC + FL + NED 
IA < = 0.25 (NV + CO + IA + WI + 070 ene 
1ت‎ + VA + NC + FL + NH) 


OH <= ا و‎ e ina 
VA <= 0.25 (NV + CO + 1A oec S ucro 
NC«- Savon + VA + NC + FL + NH) 
FL < =0.25 (NV + ÇAYA OH + VA + NC + FL + NH) 








NH < =0.25 (NV! ر‎ + OH + VA + NC + FL + NH) 


(د) يجب ألا تقل مستويات استثمار الولايات الغربية عن 1٠‏ من مستويات الولايات الشرقية. 


RR‏ ^ ا 
East States = OH + VA + NC + FL + NH‏ 
So, (NV + CO + IA + WD > = 0,60 (OH + VA + NC + FL + NH), Again we can‏ 
ويتم تنفيذ هذا القيد من خلال طرق متنوعة باستخدام [ع8<20. 
(ه) تأثير مالا يقل عن 11٠١‏ من مجموع الناسء ويكون كالتالي: 


(1ONV + 7.5CO + 8IA + 10WI + 7.5OH + 7.5VA +10 NC + 8FL + 8 NH) > = 9,200 








( و) أن يكون تأثير عدد الإناث على الأقل مثل الذكورء مما يتطلب انتقال وظائف التأثر. 
F1 = 6 women influenced, F2 = 3.5 women‏ 
F3 = 3 women influenced‏ 

F1 = 4 men influenced, F2 = 4 men 

F3 = 5 men influenced 








OTA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


























التحليلات التوجيهية: التحسين والمحاكاة 
فإذا كان إنجاز الإناث > = الذكورء فإننا نحصل على: 


(GNV +3.5CO + 31A + GWI + 3.50H + 3.5VA + GNC + 3FL + 3NH) > 3 
(ANV + 4CO + SIA + 4WI + 40H + 4VA + 4NC + 5FL + 5NH) 








وكما هو الحال من قبلء فإنه مكننا تنفيذ ذلك ف Excel‏ بطريقتين مختلفتين. 
( ز) ينبغي ألا تقل نسبة المسنين عن 67* من المجموع الكلي للأشخاص. 
وقد كان جميع الأشخاص المتأثرين على الجانب الأيسر من القيد (©). ولذلك فإن 
المسنين المتأثرين سوف يكونون كالتالي: 


(4NV + 3.500 + 451A + 4WI + 3.50H + 3.5VA + 4NC + 4.5FL + 4.5NH) 


This would be set >= 0.46" the left-hand side of int (e). (10NV + 7.5C0 + 
81A + 10W1 + 75OH + 7.5VA +10NC + 8FL + sq. which would give a right- 


side of X 
(0.46NV + 3.45CO + 3,68IA + 4.6W1 + 36 + 3.45VA + 4.6NC + 3.68FL + 
3.68NH) u 


هذا هو القيد الأخير إلى جانب فرض أن تكون جميع المتغيرات أعدادًا صحيحة. 
وقد تم ذكر كل شيء في الشروط الجبريةء وسيكون لهذا النموذج الصحيح من البرمجة ١‏ 
متغيرات قرار و٤۲‏ قيدًا (قيد واحد للمتطلبات الصحيحة). 
التنفيذ: 
سيكون أحد المناهج صارمًا في تنفيذ النموذج «النموذج القياسي»» أو نموذج شكل الصف 
حيث تتم كتابة جميع القيود بمتغيرات القرار على الجانب الأيسرء وتتم كتابة رقم على الجانب 
الأمن. ويوضح الشكل (86-7) مثل هذا التنفيذء بالإضافة إلى أنه يعرض النموذج الذي تم حله. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 














[2 





ذكاء الأعمال والت 


شكل 3-5: معادلة مضغوطة لتوزيع موارد الانتخابات 





OLLI oleg O? 








» منظور إداري 


بيانا 


«dal po Jl‏ وكذلك تزة 
E‏ 8 


65 


e 


à i 1 
5ه‎ E3117 i 
"MM | 
beg 


5 


١ تنفيذ‎ 
(غير‎ | 
nu 





ليست 
E‏ 


قيود المتكررة () و(©) بشكل فريد. بالإضاة 


فة 





resin وو روط وو‎ 
ji 7451153112151210/55377 1 
I995 
“HII 
*719531141152515545:3:34 
PIII 
L ^131511111122:3223107*75 
Lo af a3833355335503339p70T 
"IIIS 
HS 


pna 


x. 4 2 3 2 2 5 3 5 3 38 55 5 28 45 


ننا بدلا من ذلك استخدام جدول البيا 





نات لحسا 





|o 





واضحة). وهذا واضح في الث 
g‏ —— 


Den 


sl 


- gum 


شكل 6-5: نموذج لتوزيع موارد الانتخابات - إصدار قياسي 


Hii 
d asii 


00202000-05-5111 FITETETEEEIITEIIETIDAIEEYIZIPIII 


1 
(79) 


لى الحصول على جدول 











مختلفة من النموذج بطريقة 


القصل السادس 


التحليلات التوجيهية: التحسين والمحاكاة 


كما يمكن أيضًا تحديد نماذج البرمجة الخطية 1.5 (وتخصصاتها وتعميماتها) مباشرً في عدد من 
أنظمة النمذجة الأخرى سهلة الاستخدام. ومن أشهر هذه النماذج: نموذج Lindo 52:45 Lindo gu‏ 
Ca» (Systems, Inc., lindo.com; demos are available) Lingo‏ 11000 هو نموذج برمجة خطية 
۳ كما أنه نظام برمجة صحيح. ويتم تحديد النماذج في الأساس بالطريقة ذاتها التي يتم تحديدها بها 
جبريًا. وقد استندت الشركة على نجاح ليندو 11040 في تطوير لغة لينجو 1.1880 وهي لغة النمذجة 
التي تنطوي على محسن ليندو 11240 القوي والملحقات لحل المشاكل غير الخطية. وهناك العديد من 
لغاث النمذجة الأخرى المتوفرة مثل: .42/15[1»: و41311/15, بالإضافة إلى .2/51 XPRESS‏ وغيرها. 

ومن خلال مجموعة متنوعة من أساليب البرمجة الرياضية» يمكن حل نماذج التحسين الأكثر 
شيوعًاء وتتضمن هذه الأساليب ما يلي: 
- التكليف (أفضل مطابقة للأهداف). - البرمجة الحركية. - برمجة الأهداف. 


- الاستثمار (زيادة معدل العائد). - البرمجة الخطية والصحيحة. 
- نماذج الشبكة للتخطيط والجدولة. - البرمجة غير الخطية. 
- الاستبدال (وضع ميزانية رأس المال). - النقل (تقليل تكلفة الشحنات). 


- نماذج المخزون البسيط (مثل: كمية الطلب الاقتصادية). 


أسئلة مراجعة على القسم 5-5: 

-١‏ اذكر مع التوضيح الافتراضات المتضمنة في البرمجة الخطية «.1آ. 
۲- اذكر مع التوضيح خصائص البرمجة الخطية. 

"- قم بوصف مشكلة التخصيص. 


۷-1 الأهداف المتعددةء وتحليل الحساسيةء وتحليل «ماذا - لو»» والبحث عن الهدف: 

تنطوي الكثير من حالات اتخاذ القرار إن لم يكن معظمهاء على التلاعب بين الأهداف المتنافسة 
والبدائل. وبالإضافة إلى ذلك» فإن هناك عدم تأكد بدرجة كبيرة حول الافتراضات والتنبؤات 
المستخدمة في بناء نموذج التحليلات التوجيهية. وتقر الفقرات التالية ببساطة أنه يتم معالجتها 
أيضًا في برامج وتقنيات التحليلات التوجيهية. كما أن تغطية هذه التقنيات عادةً ما تكون شائعةً 
في الدورات التحليلية التوضيحية أو بحوث العمليات / العلوم الإدارية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري لفك 


الفصل السادس 


الأهداف المتعددة: 

يتم تحليل القرارات الإدارية بهدف التقييم قدر الإمكان» لمدى مساعدة كل بديل للمديرين 
على التقدم نحو أهدافهم. وللأسف. فإن تقييم المشاكل الإدارية نادرًا ما يتم بهدف واحد بسيطء 
مثل: تعظيم الربح. aig‏ نظم إدارة اليوم معقدة بدرجة كبيرة ونادرًا ما تجد أحد هذه الأنظمة 
لديها هدف واحد فقط حيث يرغب المديرون بدلا من ذلك في تحقيق أهداف متزامنة في وقت 
واحد. والتي قد تتعارض مع بعضها البعض. الجدير بالذكر أن أصحاب المصلحة المختلفة تكون 
لديهم أهداف مختلفة. لذلكء فإنه غالبًا ما يكون من الضروري تحليل كل بديل في ضوء تحديد 
كل هدف من الأهداف المتعددة (انظر 2001 Koksalan & Zionts,‏ 

وعلى سبيل المثالء فلنعتبر أن هناك شركة تحقق أرباحًاء فإنه بالإضافة إلى هدف الشركة في 
تحقيق مكاسب ماليةء فإن لديها أهداقًا أخرى ترغب في تحقيقها وهي النمو وتطوير منتجاتها 
وموظفيهاء وتوفير الأمن الوظيفي لعمالهاء وخدمة المجتمع. كما يرغب المديرون في إرضاء المساهمين 
وفي الوقت ذاته يرغبون في التمتع برواتب عالية وحسابات مصرفية.وبالإضافة إلى 0B «AUS‏ الموظفين 
يرغبون في زيادة أجورهم واستحقاقاتهم من الأرباح. وعند اتخاذ قرار - بخصوص مشروع استثماري» 
على سبيل المثال - فإن بعض هذه الأهداف تكمل بعضها البعض؛ في حين يتعارض بعضها الآخر. 
وقد وصف 5م1622 (2004) كيف تقوم عملية التحليل الهرمي (8115) جنبًا إلى جنب مع الإرمجة 
الصحيحة: بمعالجة عدة أهداف في تقييم استثمارات تقنية المعلومات (11). 

وتستند العديد من النماذج الكمية لنظرية القرار على مقارنة مقياس واحد للفعالية.وبشكل 
عام» فإن ذلك يُعد شكلًا من أشكال ال منفعة بالنسبة لصانع القرار. ولذلك» فإنه من الضروري 
عادةً تحويل مشكلة ذات أهداف متعددة إلى مشكلة قياس فعالية واحدة قبل مقارنة آثار 
الحلول. وتّعد هذه طريقة شائعة لمعالجة أهداف متعددة في نموذج LP‏ 

وهناك بعض الصعوبات التي قد تنشأ عند تحليل الأهداف المتعددة, وتتمثل في: 
- صعوبة الحصول عادةً على بيان صريح لأهداف المنظمة. 
- قد يقوم صانع القرار بتغيير الأهمية الخاصة بأهداف معينة مع مرور الوقت أو من أجل 

سيناريوهات القرار المختلفة. 
- النظر إلى الأهداف والمناهج الفرعية بنظرة مختلفة على مستويات مختلفة من التنظيم وداخل 
الإدارات المختلفة. 

- الاستجابة للتغيرات في المنظمة وبيئتها مما يترتب عليه تغيير الأهداف. 


ovv‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


- قد يصعب تحديد العلاقة بين البدائل ودورها في تحديد الأهداف. 
- حل المشاكل المعقدة من قبل مجموعات من صانعي القرارء لكل واحد منهم رؤية شخصية 
خاصة به في تناول المشكلة. 
- قيام المشاركين بتقييم الأهمية (الأولويات) الخاصة بمختلف الأهداف» بطريقة مختلفة. 
وعند العمل مع مثل هذه الحالات» فإن هناك عدة طرق يمكن استخدامها بمعالجة الأهداف 
المتعددة: وتتمثل أكثر هذه الطرق شيوعًا في: 
- نظرية المنفعة. 
- برمجة الأهداف. 
- التعبير عن الأهداف كقيودء باستخدام 1۲. 
- نظام النقاط. 


تحليل الحساسية: 

يقوم منشئ النماذج بعمل تنبؤات وافتراضات تتعلق ببيانات المدخلات» والتي يتناول الكثير 
منها تقييم العقود الآجلة غير المؤكدة. وعندما يتم حل النموذج فإن النتائج تعتمد على هذه 
البيانات. ويحاول تحليل الحساسية تقييم أثر التغيير في بيانات المدخلات أو اللَعْلمات على الحل 
المقترح (أي: متغير النتيجة). 

ونظرًا لأن تحليل الحساسية يسمح بالمرونة والتكيف مع الظروف اللتغيرة ومتطلبات مختلف 
حالات اتخاذ القرارء كما أنه يوفر فهمًا أفضل للنموذج ووضع صنع القرار الذي يحاول وصفه 
ويسمح للمدير بإدخال البيانات لزيادة الثقة في النموذج. فإنه يُعد مهما للغاية في التحليلات 
التوجيهية. ويقوم تحليل الحساسية باختبار العلاقات مثل: 
- أثر التغيرات في المتغيرات الخارجية (الغير (de parameters clslslls (lle 8,5. ul åL‏ 

متغير النتيجة (النتائج). 

- أثر عدم التأكد في تقدير المتغيرات الخارجية. 
- تأثيرات التفاعلات المستقلة المختلفة بين المتغيرات. 
- قوة القرارات في ظل الظروف المتغيرة. 

وتستخدم تحليلات الحساسية من أجل: 
- مراجعة النماذج لاستبعاد الحساسيات الكبيرة جدًا. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ovy‏ 


الفصل السادس 


- إضافة تفاصيل حول المتغيرات أو السيناريوهات الحساسة. 

- الحصول على تقديرات أفضل للمتغيرات الخارجية الحساسة. 

- تغيير نظام العام الحقيقي للحد من الحساسيات الفعلية. 

- قبول واستخدام العام الحقيقي الحساس (وبالتالي سريع التأثر بالنقد)» مما يؤدي إلى المراقبة 
المستمرة والوثيقة للنتائج الفعلية. 

أما نوعا تحليلات الحساسية فهما يتمثلان في التلقائية» والتجربة والخطأ. 

- تحليل الحساسية التلقاي: يتم إجراء الحساسية التلقاي في تطبيقات نموذجية كمية قياسية 
JELI Jew deg LP Jio‏ فإن هذا التحليل يقوم بالإبلاغ عن النطاق الذي يمكن أن يختلف 
فيه متغير إدخال معين أو قيمة مَعْلمة (مثل: تكلفة الوحدة) دون أن يكون له أي تأثير 
خطير على الحل المقترح. وعادةً ما يقتصر تحليل الحساسية التلقائي على تغيير واحد في كل 
s‏ وليس لكل المتغيرات بل فقط بلتغيرات معينة. وعلى الرغم من ذلكء؛ فإن هذا التحليل 
قوي بسبب قدرته على إنشاء نطاقات وحدود بسرعة كبيرة (وبجهد حاسوبي إضافي أو بدون 
أي جهد إضافي). ويقوم :©5117 وتقريبًا جميع حزم البرامج الأخرى مثل 1.1000 بتوفير تحليل 
الحساسية. وبالنظر في مثال شركة MBI‏ الذي قدمناه فيما سبق. فإنه من الممكن استخدام 
تحليل الحساسية لتحديد ما إذا كان الجانب الأمن من القيد التسويقى على 00-8 بواسطة 
وحدة واحدة فإن صافي الربح سيزيد بمقدار 1,800:89 5. وهذا التناقص إلى الصفر يكون 
صحيحًا بالنسبة إلى الجانب الأممن. كما يمكن إجراء تحليل إضافي كبير على طول هذه الخطوط. 

- تحليل الحساسية والكشف عن الأخطاء: من خلال نهج التجربة والخطأ البسيط يمكن تحديد 
تأثير التغييرات في أي متغير, أو في عدة متغيرات؛ حيث يمكنك تغيير بعض بيانات الإدخال وحل 
المشكلة مرة أخرى. وبتكرار التغيبرات عدة مرات» فإنه قد يتم اكتشاف حلول أفضل وأحسن. 
ومثل هذا الاختبا. والذي يسهل تنفيذه عند استخدام برامج النمذجة المناسبة» مثل: برنامج 
Excel‏ له أسلوبان: تحليل ”ماذا - لو“» بالإضافة إلى البحث عن الهدف .Goal Seeking‏ 


تحليل ”ماذا - لو»: 
وقد أنشئ alos‏ ”ماذا - لو“ على أساس سؤال ماذا سيحدث للحل إذا تم تغيير متغير إدخال 
أو افتراض أو قيمة مَعْلمة؟ وفيما يلي بعض الأمثلة: 
- ماذا سيحدث لإجمالي تكلفة المخزون إذا ارتفعت تكلفة حفظ المخزون بنسبة 51٠١‏ 


- ما هي حصة:السوق إذا ارتفعت ميزانية الإعلان بنسبة 570 


ove‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


ويُعد طرح هذه الأنواع من الأسئلة على نموذج الحاسب والحصول على إجابات فورية أمرًا 
سهلًا بالنسبة للمديرين: إذا ما تعاملوا مع واجهة المستخدم المناسبة. وعلاوةً على eUS‏ فإن 
المديرين يمكنهم إجراء العديد من الحالاتء وبالتالي تغيير النسبة المئوية» أو أي بيانات أخرى في 
السؤال. حسب رغبتهم. ويستطيع صانع القرار فعل كل ذلك بشكل مباشرء دون مبرمج حاسب. 

ويقدم الشكل )٠١-1(‏ مثالًا لجدول بيانات عن سؤال ”ماذا - لو“ مشكلة التدفق النقدي. 
فعندما يقوم المستخدم بتغيير الخلايا التي تحتوي على المبيعات الأولية (من ٠٠١‏ إلى )٠١١‏ 
ومعدل نمو المبيعات (من1*“ إلى ×٤‏ لكل ربع)» فإن البرنامج يقوم على الفور بإعادة حساب قيمة 
صافي الربح السنوي (من 881 إلى 81817). وقد كانت المبيعات الأولية في البداية ٠٠١‏ حيث نمت 
uy JSI XY Jaee‏ محققةً ربحًا صافيًا قدره /4111. حيث يؤدي تغيير خلية المبيعات الأولية إلى 
٠‏ بالإضافة إلى تغيير معدل مو المبيعات إلى 6* إلى رفع صافي الربح السنوي إلى 51/1. ويُعد 
تحليل ”ماذا - لو“ شائعًا في العديد من أنظمة القرار. ويتم منح المستخدمين الفرصة لتغيير 
إجاباتهم على بعض الأسئلة الخاصة elal‏ والحصول على اقتراح مُعَدَّل. 










33 
5 

اتقييم المبيعات الأولية (الخلية 810) 6 
ومعدل نمو المبيعات (الخلية 811) 0 $ Unitrevenue‏ 7 
لتقييم التغير فى الأرباح السنوية eor OSA‏ 
[initial sales 120‏ 10 

11 Sales growth rate 0.04 مبيعات أولية بمقدار 100 بمعدل نمو ربع سنوی‎ 
12 127 A E BO ERS RAE 

ارنة مع حالة ماذادلو لمبيعات أولية بمقدار 120 d‏ ات ی ا 
بمعدل نمو ربع سنوی قدره 4% 14 

15 

16 

17 Cash Fiow Model for 1996. 

18 Annual 

19 an Q2 aus arra Total 

20 Sales 120 125 130 135 510 

21 Revenue 5 MA $. 150 5 1556 5 162 5 u 

22 Variable cost $ 725 75 5 LE s $ 36 

23 Red cost $ OY US mn$ ns m 

24 Net profit 3- «4* A. ONS «$ 10 

25 





شكل :٠١-5‏ نموذج لحالة ”ماذا - لو“ من خلال ورقة عمل 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ننفت 








الفصل السادس 


البحث عن الهدف :Goal Seeking‏ 

يقوم البحث عن الهدف Goal Seeking‏ بحساب قيم المدخلات اللازمة لتحقيق اللمستوى 
المطلوب من المخرجات (الهدف). ويمثل هذا النهج نهج الحل المتأخر. وفيما يلي بعض الأمثلة 
على البحث عن الهدف عصكاءء56 6021: 
- ما هي الميزانية السنوية للبحث والتطوير اللازمة لتحقيق معدل نمو سنوي بنسبة %10 بحلول $V-M els‏ 
- كم عدد الممرضات اللازمة لتقليل متوسط وقت الانتظار للمريض في غرفة الطوارئ إلى أقل من ٠١‏ دقائق؟ 

ويقدم الشكل )١١1-7(‏ مثالًا على البحث عن الهدف Goal Seeking‏ فعلى سبيل المثال» 
معدل العائد الداخلي (1810) في نموذج التخطيط المالي 81 هو معدل الفائدة الذي ينتج قيمة 
صافية حالية (21577) صفر. ويمكننا حساب صافي القيمة الحالية للاستثمارات المخطط لهاء من 
خلال النظر إلى تدفق العائدات السنوية في العمود 8. كما يمكننا تحديد معدل العائد الداخلي 
من خلال تطبيق البحث عن الهدف 428اء56 6021.: حيث تكون 71257 صفرًا. أما الهدف المراد 
تحقيقه والذي يحدد معدل العائد الداخلي لهذا التدفق النقدي, بما في ذلك الاستثمار؛ فهو أن 
تساوي القيمة الصافية الحالية 215177 صفرًا. وقد قمنا بتعيين خلية ۲۷× إلى القيمة ٠‏ عن طريق 
تغيير خلية معدل الفائدة. وكان الجواب ۳۸,۷۷۰0۹. 








شكل :١١-5‏ تحليل البحث عن الهدف 


ovi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التوجيهية: التحسين والمحاكاة 


حساب نقطة تحقيق التعادل عن طريق استخدام البحث عن الهدف :Goal Seeking‏ 
as (ls‏ تطبيقًا هامًا للاستهداف 8دنا566 6021. وهذا يتضمن قيمة متغيرات القرار (مثل: 
الكمية التي يُراد إنتاجها) التي تحقق ربحًا صفريًا. 

وقد يكون من الصعب إجراء تحليل الحساسية في العديد من برامج التطبيقات العامةء نظرًا لأن الروتين 
المكتوب مسبقًا ل يمثل عادةً سوى فرصة محدودة لطرح أسئلة ”ماذا - لو". وينبغي أن يكون تنفيذ كل 
من ”ماذا - لو“ والبحث عن الهدف Lol elis $ Myu Gaf Goal Seeking‏ الدموغرافي DSS)‏ 


أسئلة مراجعة على القسم :۷-١‏ 

-١‏ اذكر بعضًا من الصعوبات التي قد تظهر عند تحليل أهداف متعددة. 

۲- اذكر أسباب القيام بتحليل الحساسية. 

*- وضح لماذا قد يستخدم أحد المديرين تحليل ”ماذا - لو“. 

-Goal Seeking Sagl je al طاذا قد يقوم المدير باستخدام‎ bg -é 


8-1 تحليل القرار باستخدام جداول القرار وأشجار القرار: 

بالنسبة لحالات القرار التي تنطوي على عدد محدود من البدائل ale glg‏ 
ما يكون عددًا غير كبي. فإنه يتم تخطيطها باستخدام نهج يسمى تحليل القرار (انظر 
-(Arsham, 2006a,b; Decision Analysis Society, decision analysis. society. informs. org‏ 
حيث يتم باستخدام هذا النهج: سرد البدائل في جدول أو رسم بياني» مع مساهماتها المتوقعة 
للهدف (الأهداف) بالإضافة إلى احتمالية الحصول على المساهمة. ومن الممكن تقييم ذلك من 
أجل تحديد البديل الأفضل. 

ويمكن استخدام جداول القرارات أو أشجار القرار لصياغة حالات الأهداف الفردية. كما يمكن 
وضع أهداف متعددة (معايير) مع العديد من التقنيات الأخرى الموضحة لاحقًا في هذا الفصل. 


جداول القرارات: 


تقوم جداول القرارات بتنظيم المعلومات والمعرفة بشكل ملائم بطريقة منتظمة وجدولية 
بغرض إعدادها للتحليل. فعلى سبيل المثالء لنفترض أن شركة استثمار تقوم بدراسة الاستثمار في 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 


الفصل السادس 


بديل من البدائل الثلاثة: السنداتء eaa sl‏ أو شهادات الإيداع (01(5)): فإن اهتمام الشركة 
سيكون مُنْصبّا على هدف واحد. ألا وهو زيادة العائد على الاستثمار إلى أقصى حد بعد عام 
واحد. فإذا اهتمت الشركة بأهداف أخرىء مثل السلامة أو السيولة» فإنه سيتم تصنيف المشكلة 
باعتبارها أحد مشاكل تحليل القرارات متعدد المعايير (انظر 2001 (Koksalan & Zionts,‏ 

ويعتمد العائد على حالة الاقتصاد في وقت ما في المستقبل (غالبًا ما تسمى حالة الطبيعة)» والتي 
يمكن أن تكون في حالة نمو قويء أو ركود, أو تضخم. وفيما يلي العوائد السنوية التي يقدرها الخبراء: 
- إذا كان الاقتصاد ينمو بقوةء فإن عائد السندات سيكون ۱١‏ والأسهم ٠١‏ والودائع لأجل 1,0. 
- وفي حالة أن يكون الركود سائدًاء فإن عائد السندات سيكون 1 والأسهم AY‏ والودائع لأجل ALO‏ 
- وإذا كان التضخم هو السائد» فإن عائد السندات سيكون ۳> أما الأسهم فستحقق خسارة ۲ 

وستحقق الودائع لأجل عائد 1,0. 

وتكمن المشكلة في اختيار أفضل بديل للاستثمار. ومن المفترض أن تكون هذه البدائل منفصلة. وينبغي 
التعامل مع مجموعات مثل استثمار 0٠‏ في السندات و٠0‏ في الأسهم على اعتبار أنها بدائل جديدة. 

ويمكن النظر إلى مشكلة اتخاذ القرار في الاستثمار على اعتبار أنها لعبة بين شخصين Kelly, Jil)‏ 
2. فالمستثمر يصنع الاختيار (أي التحرك)» ومن ثم تحدث حالة طبيعية (يحدث التحرك). 
ويوضح الجدول (1-) مردود نموذج رياضي؛ حيث يشتمل الجدول على متغيرات القرار (البدائل)» 
ومتغيرات لا يمكن السيطرة عليها (حالات الاقتصادء مثل: البيئة)» ومتغيرات النتائج (العائد ا متوقع 
مثل: النتائج). وقد تم تصميم جميع النماذج في هذا القسم في إطار جدول بيانات. 

وإذا كان هناك مشكلة في اتخاذ القرار في ظل التأكدء فإننا سنعرف ماذا سيكون الاقتصاد كما 
يمكننا بسهولة اختيار أفضل استثمار. غير أن ذلك ليس هو الحالء ولذلك فإنه ينبغى علينا أخذ 
حالكي عدم التأكد والخطر في الاعتبار. فمع عدم التأكد. فإننا لا نعرف احتمالات كل حالة من 
الطبيعة. ومع الخطرء سنفترض أننا نعرف الاحتمالات التي تحدث بها كل حالة من الطبيعة. 

معالجة عدم التأكد: هناك عدة طرق للتعامل مع عدم التأكد. فعلى سبيل ال مثالء فإن النهج 
التفاؤلي يفترض حدوث أفضل نتيجة ممكنة لكل بديل ومن تم يختار أفضل الأفضل (أي: الأسهم). 
أما النهج التشاؤمي فإنه يفترض حدوث أسوأ نتيجة ممكنة لكل بديل ثم يختار الأفضل من بين النتائج 
(أي: شهادات الإيداع 025). وهناك نهج آخر يفترض ببساطة أن جميع حالات الطبيعة متساوية في 
الاحتمالات (انظر Clemen & Reilly, 2000; Goodwin & Wright, 2000; Kontoghiorghes,‏ 
.(Rustem, & Siokos, 2002‏ وعند التعامل مع حالة عدم التأكد فإن كل نهج من هذه المناهج 


OVA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


لديه مشاكل خطيرة عند تداوله لها. وينبغي على المحلل أن يحاول جمع ما يكفي من المعلومات 
قدر الإمكان» بحيث يمكن التعامل مع المشكلة في إطار التأكد أو الخطر المفترضة. 

معالجة الخطر: تعد طريقة اختيار البديل بأكبر قيمة متوقعة هي الطريقة الأكثر شيوعًا لحل 
مشكلة تحليل الخطر. ولنفترض أن الخبراء يقدرون فرصة النمو القوي عند 0۰ وفرصة الركود 
عند ۳١‏ وفرصة التضخم عند ,#7١‏ فإن جدول القرار عندئذ ستتم إعادة كتابته مع الاحتمالات 
المعروفة (انظر الجدول 8-1). كما يتم حساب القيمة عن طريق ضرب النتائج (أي: النواتج) 
حسب الاحتمالات الخاصة بها وإضافتها. فعلى سبيل المثالء الاستثمار في السندات يؤدي إلى عائد 
متوقع 638 AW (50) &3 (Y) e Y (SY) 2 A£‏ 

وفي بعض الأحيان فإن هذا النهج قد يكون إستراتيجية خطرة نظرًا لأن فائدة كل نتيجة 
محتملة رها تكون مختلفة عن القيمة. وحتى في حالة وجود فرصة ضئيلة لخسارة كارثيةء فإن 
القيمة ال متوقعة قد تبدو معقولة» غير أن المستثمر قد يكون غير مستعد لتغطية الخسارة. فعلى 
سبيل المثالء لنفترض أن مستشارًا مالا يقدم لك استثمارًا «شبه مؤكد» بقيمة 5٠٠٠١‏ فإنه من 
الممكن أن يضاعف ذلك أموالك في يوم واحدء وعندئذ سيقول لك المستشار: ”حستًاء هناك 
احتمال ٠,۹۹۹٩‏ بأنك ستضاعف أموالك» ولكن للأسف هناك احتمال ٠.٠٠٠٠‏ أنك ستكون مسؤولًا 
عن خسارة $0٠٠,٠٠١‏ من حسابك“. وتكون القيمة ا متوقعة لهذا الاستثمار كالتالي: 
Y ($08 - $e)‏ )$5 - ,$1( 48333 
-$0.,V-‏ .,2$333- 
- 

ومن الممكن أن تكون الخسارة المحتملة كارثية لأي مستثمر صغير ليس مليارديرًا. واعتمادًا 
على قدرة المستثمر على تغطية الخسارة: فإن للاستثمار أدوات مختلفة متوقعة. ولابد أن تتذكر 
جيدًا أن المستثمر يتخذ القرار مرة واحدة فقط. 


جدول 8-5: نموذج لجدول حالة الطبيعة (متغيرات لا يمكن السيطرة عليها) 





البديل النمو القوي (*) الركود (*) التضخم (#) 
السندات Y. VM Wwe‏ 
الأسهم Y,- Ys Y6,-‏ 
شهادات الإيداع و0 Vo Vo Vo‏ 











ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ova‏ 




















الفصل السادس 


أشجار القرار: 
تعد شجرة القرار تمثيلًا بديلًا لجدول القرار (وللاطلاع على أمثلة. انظر 
.)Mind "10015 td. mindtools. com‏ وتقوم شجرة القرار بإظهار علاقات المشكلة بيانيًًا كما 
يمكنها التعامل مع حالات معقدة في نموذج مضغوط. US gag‏ فإن شجرة القرارات قد تكون 
مُرهقة إذا كان هناك العديد من البدائل أو حالات الطبيعة. وتشتمل كل من ععدء1:6) 
Software Inc. treeage.com) TreeAge Pro (Palisade Corp., palisade. Com)‏ 
As PrecisionTrees‏ أنظمة تحليل شجرة القرار القوية والبديهية والمتطورة. كما يُقدم DTI‏ 
الموردون أيضًا أمثلة ممتازة لأشجار القرار المستخدمة في الممارسة. ومن الألاحظ أن مصطلح 
شجرة القرار قد استخدم لوصف نوعين مختلفين من النماذج والخوارزميات» في حين أنه في 
السياق الحالي تشير أشجار القرار إلى تحليل السيناريو. ومن جانب آخرء فإن بعض خوارزميات 
التصنيف في التحليل التنبؤي (انظر الفصلين 6 09) أيضًا خوارزميات شجرة القرار. 
وقد ورد في الجدول (5-5) حالة مبسطة للاستثمار لأهداف متعددة (وهي حالة اتخاذ قرار 
لتقييم البدائل بالعديد من الأهداف المتناقضة أحيانًا). وتتمثل الأهداف (المعايير) الثلاثة في كل من 
العائد والسلامة والسيولة. وهذه الحالة تم اتخاذ القرار فيها في ظل التأكد المفترض؛ بمعنى أنه يتم 
توقع نتيجة واحدة ممكنة لكل بديل؛ كما يمكن أخذ حالات الخطر أو عدم التأكد الأكثر تعقيدًا هي 
الأخرى في الاعتبار. وبعض النتائج تكون نوعية (مثل: منخفضة: عالية) بدلا من أن تكون رقمية. 


جدول 4-5: أهداف متعددة 














البديل العائد () السلامة السيولة 
السندات NE‏ مرتفعة مرتفعة 
الأسهم ^r‏ | منخفضة مرتفعة 
شهادات الإيداع و0 Vo‏ | مرتفعة جدًا مرتفعة 


ومزيد من المعلومات حول تحليل القرار انظر Goodwins .(2000) Reilly g Clemen‏ 5 )2000( 
Wright‏ بالإضافة إلى مجتمع تحlيJ‏ |لةرlر Decision Analysis Society (informs.org/Community/‏ 
deg DAS)‏ الرغم من أن ذلك الأمر معقد للغاية» إلا أنه من الممكن تطبيق البرمجة الرياضية مباشرةً في 
حالات اتخاذ القرار تحت المجازفة. وسوف نناقش العديد من الطرق الأخرى لمعالجة الخطر في جزء لاحق 
من الكتاب» وهذا يتضمن ال محاكاةء وعوامل التأكد بالإضافة إلى المنطق الغير واضح. 


01° ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 




















التحليلات التوجيهية: التحسين والمحاكاة 


أسئلة مراجعة على القسم :۸-٦‏ 

-١‏ ما هو جذول القرار؟ 

۲- ما هي شجرة القرار؟ 

AS -Y‏ هكن استخدام شجرة القرار في صنع القرار؟ 

-٤‏ قم بوصف المقصود بأن يكون لديك أهداف متعددة. 


1-5 مقدمة في المحاكاة: 


نقدم في هذا القسم والقسم التالي مجموعةً من التقنيات التي تُستخدم لدعم القرار. وعلى 
نطاق واسع» فإن هذه الأساليب جميعها تقع تحت مظلة ا محاكاة. وا محاكاة تمثل الواقع. وتعتبر 
المحاكاة في أنظمة القرارء تقنية لإجراء تجارب (مثل: تحليلات ”ماذا - لو“) مع جهاز حاسب على 
نموذج من نظام الإدارة. وبا معنى الحرف للكلمة فإن ا محاكاة تعتبر طريقة وصفية أكثر من كونها 
إرشادية. كما أنه ليس هناك بحث تلقائي عن الحل الأمثل. وبدلًا من ذلك» فإن نموذج المحاكاة 
يصف أو يتنبا بخصائص نظام معين في ظل ظروف مختلفة؛ حيث يمكن اختيار أفضل البدائل 
المتعددة عندما يتم حساب قيم الخصائص. وللحصول على تقدير (وتغير) للتأثير الكلي لإجراءات 
معينة: فإنه عادةً ما تقوم عملية المحاكاة بتكرار التجربة عدة مرات. وتعتبر محاكاة الحاسب 
مناسبة ممعظم الحالات» وعلى الرغم من ذلك فإن هناك بعض عمليات المحاكاة اليدوية المعروفة 
(مثل: قيام قسم شرطة المدينة بمحاكاة جدولة سيارتها الدورية مع عجلة لعبة الكرنفال). 

وتنطوي بعض حالات اتخاذ القرار الحقيقية في العادة. على بعض العشوائية. وبسبب تعامل 
العديد من مواقف القرار مع حالات شبه منظمة أو غير منظمة» فإن الواقع معقد إلى الدرجة 
التي قد تجعل من الصعوبة تمثيله عن طريق التحسين أو نماذج أخرىء ولكن يمكن استخدام 
المحاكاة لمعالجته في كثير من الأحيان. وتُعد المحاكاة واحدة من أكثر طرق دعم القرار شيوعًا. 
وللاطلاع على مثال» انظر الحالة العملية (1-1). كما توضح الحالة العملية )۷-١(‏ قيمة المحاكاة 
في بيئة لا يتوفر فيها الوقت الكافي لإجراء التجارب التحليلية. 


الخصائص الرئيسة للمحاكاة: 
عادةً ما تتضمن المحاكاة بناء نمموذج للواقع من أجل المجال العملي. ومقارنةً بالنماذج التحليلية 
الأخرىء فإن نماذج المحاكاة قد تعاني من قلة عدد الافتراضات حول حالة القرار. وبالإضافة إلى 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oN!‏ 


الفصل السادس 


ذلك فإن المحاكاة تعد تقنية لإجراء التجارب. ولذلك فإنها تشتمل على اختبار قيم محددة للقرار 
أو المتغيرات التي لا يمكن السيطرة عليها في النموذج مع ملاحظة التأثير على متغيرات المخرجات. 
وأخيراء فإن المحاكاة لا تستخدم عادةً إلا عندما تكون المشكلة معقدة للغاية بحيث لا يمكن 
معالجتها باستخدام تقنيات التحسين الرقمي. ويقصد بالتعقيد في هذه الحالة إما عدم إمكانية 
صياغة المشكلة من أجل التحسين (فعلى سبيل ال مثال: بسبب الافتراضات الغير تطبيقية)» أو أن 
الصيغة كبيرة جدًاء أو أن هناك الكثير من التفاعلات بين المتغيرات» أو أن المشكلة عشوائية في 


طبيعتها (أي: تعرض خطر أو عدم التأكد). 


ONY 


حالة عملية ۷-١‏ 
محاكاة آثار تدخلات الالتهاب الكبدي 8 

على الرغم من قيام الولايات المتحدة باستثمارات كبيرة في مجال الرعاية الصحية, 
غير أن هناك بعض المشاكل التي تبدو وكأنها تتحدى الحل. فعلى سبيل المثالء هناك 
نسبة كبيرة من السكان الآسيويين في الولايات المتحدة أكثر عرضة من غيرهم للإصابة 
بفيرس (8). وإذا لم يتم علاج المرض بشكل فعالء فإن واحدًّا من كل أربعة أشخاص 
مصابين بالعدوى إصابة مزمنة مهدد بالإصابة بسرطان الكبد أو تليف الكبد. فضلًا 
عن المشاكل الاجتماعية المرتبطة بالمرض (مثل العزل). وقد يكون التحكم في هذا 
المرض مكلقًا للغاية. وهناك عدد من المعايير للتحكم في ذلك المرضء وتتضمن الفحص» 
والتطعيم: وإجراءات العلاج. كما تتردد الحكومة في إنفاق الأموال على أي طريقة 
للتحكم في المرض إلا إذا كانت فعالة من حيث التكلفة» كما أنه ليس هناك دليل على 
تحسن صحة المصابين بهذا المرض. وعلى الرغم من أن جميع معايير التحكم ليست 
مثالية لجميع الحالات» غير أن أفضل طريقة أو مجموعة طرق مكافحة هذا المرض غير 
معروفة حتى الآن. 

المنهجية / الحل: 

قام فريق متعدد التخصصات والذي تألف من أولئك الذين لديهم خلفيات طبية 
وإداريةء وهندسيةء بتطوير نموذج رياضي يستخدم أساليب أبحاث العمليات (0۸) والتي 
حددت التركيبة الصحيحة من إجراءات التحكم التي يجب استخدامها بمكافحة التهاب 
الكبد الوبائ 8 في سكان آسيا وجزر المحيط الهادئ. وعادةً ما يتم استخدام التجارب 
السريرية في المجال الطبي من أجل تحديد أفضل مسار للعمل في علاج الأمراض والوقاية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


منها. ويتمثل تعقيد هذه الحالة في كون الالتهاب الكبدي 8 يستغرق فترة طويلة غير 
معتادة من الوقت حتى يحدث تقدم. وقد تم استخدام نماذج وطرق 016 يسبب التكلفة 
العالية التي تصاحب التجارب السريرية في هذه الحالة. وقد قدمت مجموعة من نماذج 
ماركوف 2191107 ونماذج اتخاذ القرار طريقة أكثر فعالية من حيث التكلفة لتحديد 
تركيبة معايير الرقابة التي يجب استخدامها في أي وقت. ويساعد نموذج القرار في قياس 
الفوائد الاقتصادية والصحية لمختلف الإمكانات الخاصة بالفحص والعلاج والتنقيح. كما 
يُستخدم نموذج ماركوف 231107 لنمذجة تطور الالتهاب الكبدي 8. وقد تم إنشاء 
النموذج الجديد استنادًا على المؤلفات والخبرات السابقة من أحد الباحثين بالإضافة إلى 
ما يُستمد من البيانات الفعلية الحالية للعدوى والعلاج. وقد قام صانعو السياسة ببناء 
النموذج الجديد باستخدام 1:61 :1/]1705015 لأنه سهل الاستخدام. 

النتائج / الفوائد: 

وقد تم تحليل النموذج الناتج مقارنة ببرامج التحكم الموجودة في كل من الولايات 
المتحدة والصين. ففي الولايات المتحدة تم تطوير أربع إستراتيجيات ومقارنتها 
بالإستراتيجية الحالية. وتتمثل هذه الإستراتيجيات الأربع في: 

-١‏ يتم تطعيم جميع الأفراد. 

۲- يتم فحص الأفراد أولًا لتحديد ما إذا كانوا مصابين بعدوى مزمنة. فإذا كانت 
الإجابة بنعم» فعندئذ يتم التعامل معهم. 

۳- يتم فحص الأفراد أولًا لتحديد ما إذا كان لديهم عدوى مزمنة. فإذا كان لديهم 
العدوىء يتم علاجهم. وبالإضافة إلى ذلك يتم أيضًا فحص المرضى القرّبِين للمصابين 
وتلقيحهم إذا لزم الأمر. 

ع- يتم فحص الأفراد أولا لتحديد ما إذا كانوا مصابين بعدوى مزمنة أو بحاجة 
إلى تطعيم. فإذا كانوا مصابينء يتم علاجهم. وإذا كانوا بحاجة إلى التطعيم: يتم تطعيمهم. 

وقد أشارت نتائج المحاكة إلى أن إجراء اختبارات الدم لتحديد العدوى المزمنة 
وتطعيم الأشخاص المقربين من الناس المصابين تعد فعالة من حيث التكلفة. 

وف الصين» ساعد النموذج على تصميم سياسة تطعيم للأطفال وا مراهقين. وقد تمت 
مقارنة هذه السياسة مع مستويات التغطية الحالية للتطعيم ضد الالتهاب الكبدي 8. وقد 
انتهت إلى أنه عندما يتم تطعيم الأفراد دون سن 3اعامًاء فإن ذلك سيؤدي إلى تحسين 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري وك 


الفصل السادس 


النتائج الصحية على المدى الطويل. وق الواقع» فإن هذه السياسة كانت فاعليتها من حيث 
التكلفة المالية أكثر من فاعلية السياسة الحالية لمكافحة المرض في مكان ما في وقت التقييم. 
أسئلة للمناقشة: 
-١‏ وضح ما تتميز به طرق 0۸ مثل ال محاكاة على طرق التجارب السريرية في تحديد 
أفضل قياس للسيطرة على الالتهاب الكبدي 8. 
۲- ما هي الطرق التي يوفر بها القرار ونموذج ماركوف 281107 وسائل فعالة من 
حيث التكلفة بمكافحة المرض؟ 
"- ناقش كيف تكون الخلفية متعددة التخصصات أصلًا في إيجاد حل للمشكلة 
الموضحة في القضية. : 
-٤‏ إلى جانب الرعاية الصحية: اذكر في أي مجال يمكن مثل هذا النهج النمطي أن 
يساعد في تقليل التكلفة. 
Source: Adapted from Hutton, D. W., Brandeau, M. L., & So, S. K. (2011). Doing good with‏ 
good OR: Supporting cost-effective Hepatitis B interventions. Interfaces, 41(3), 289300-.‏ 
مزايا المحاكاة: 
تُستخدم المحاكاة في نمذجة دعم القرار للأسباب التالية: 
- تعد هذه النظرية واضحة إلى حد ما. 
- من الممكن تحقيق قدر كبير من ضغط الوقت» مما نح ال مدير الشعور سريعًا ببعض التأثيرات 
للعديد من السياسات على المدى الطويل (من١‏ إلى ١٠سنوات).‏ 
- تعد ا محاكاة وصفية وليست معيارية. وهذا يسمح للمدير بطرح أسئلة ”ماذا - لو“. كما يمكن 
للمدير استخدام نهج التجربة والخطأ لحل المشاكلء كما يمكن أن يفعل ذلك بشكل أسرع: 
وعلى حساب أقل» وبدقة أكبرء بأقل المخاطر. 
- كما يمكن للمدرب أن يقوم بالتجريب من أجل تحديد متغيرات الق رار وأي أجزاء من البيئة 
مهمة بالفعل» ومع بدائل مختلفة. 
- يتطلب نموذج المحاكاة الدقيقة معرفة وثيقة با مشكلةء مما يجبر مصمم النموذج على التفاعل 
باستمرار مع ال مدير. وهذا الأمر مطلوب من أجل تطوير أنظمة دعم القرار لأن كلا من المطور 
واطدير يكتسبان Las] as‏ للمشكلةء وللقرارات المحتملة المتاحة. 
- يتم تصميم النموذج من منظور المدير. 


ONE‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


- يُصمم نموذج المحاكاة من أجل مشكلة معينة وغالبًا لا يمكن حل أي مشكلة أخرى. وبالتاليء لا 
يحتاج المدير إلى أي فهم عام؛ OV‏ كل مكون في النموذج يتوافق مع جزء من النظام الحقيقي. 

- يمكن للمحاكاة التعامل مع مجموعة كبيرة جدًا من أنواع المشاكلء مثل: المخزونء والموظفين» 
بالإضافة إلى الوظائف الإدارية عالية المستوىء مثل: التخطيط بعيد المدى. 

- من ا ممكن أن تتضمن ال محاكاة بشكل عام التعقيدات الحقيقية للمشاكل؛ فالتبسيط ليس ضروريًا. 
وعلى سبيل ال مثال» قد تستخدم ا محاكاة توزيعات احتمالية حقيقية بدلا من توزيعات نظرية تقريبية. 

- تنتج المحاكاة العديد من مقاييس الأداء المهمة تلقائيًا. 

- غالبًا ما تكون المحاكاة هي الأسلوب الوحيد لنمذجة أنظمة دعم القرار والتي يمكنها التعامل 
بسهولة مع المشاكل غير المنظمة نسبيًا. : 

- وتتوفر بعض حزم المحاكاة سهلة الاستخدام نسبيًًا (مثل: محاكاة مونت کارلو .(Monte Carlo‏ 
وهي بالإضافة إلى اشتمالها على حزم جداول البيانات (مثل: >1151©). فإنها تتضمن أيضًا 
التأثير على برمجيات الرسم البياني» وحزم جافا 278[ (وغيرها من تطورات الويب)» وسوف تتم 
مناقشة أنظمة المحاكاة التفاعلية المرئية في وقت قريب. 


عيوب المحاكاة: 
تتمثل العيوب الرئيسة للمحاكاة فيما يلي: 

- لا يمكن ضمان الحل الأمثلء لكن بشكل عام توجد حلول جيدة نسبيًا. 

- قد تكون عملية تصميم نموذج ام محاكاة بطيئة ومكلفةء في حين أن أنظمة النمذجة الحديثة 
أسهل في الاستخدام من أي وقت مضى. 

- عادةً ما تكون الحلول والاستدلالات من دراسة المحاكاة غير قابلة للتحويل إلى مشاكل أخرى 
نظرًا لأن النموذج يتناول عوامل مشكلة فريدة من نوعها. 

- أحيانًا يكون من السهل شرح المحاكاة للمديرين في حين أن الطرق التحليلية غالبًا ما يتم تجاهلها. 

- في بعض الأحيان تتطلب برامج المحاكاة مهارات خاصة بسبب تعقيد طريقة الحل الرسمي. 


منهجية المحاكاة: 


تنطوي المحاكاة على وضع نموذج لنظام حقيقي وإجراء تجارب متكررة عليه. 
أما منهجية المحاكاة فإنها تتكون من الخطوات التالية» كما هو موضح ف الشكل :)٠١-١(‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ono‏ 


الفصل السادس 


-١‏ تحديد المشكلة: علينا دراسة وتصنيف المشكلة الواقعية: ثم نحدد لماذا يُعد نهج المحاكاة 
مناسبًا. وهنا يتم التعامل مع حدود النظام والبيئة وغيرها من جوانب توضيح المشكلة. 

؟- بناء نموذج المحاكاة: وتنطوي هذه الخطوة على تحديد المتغيرات وعلاقاتها فضلًا عن جمع البيانات. 
وغالبًا ما يتم وصف العملية باستخدام مخطط انسيابيء ومن ثم تتم كتابة برنامج حاسب. 

-Y‏ اختبار النموذج والتحقق من صحته: ينبغي أن يكون نموذج المحاكاة ممثلًا للنظام الجاري 
دراسته بشكل صحيح. ولابد من اختبار ذلك والتحقق من صحته. 

-٤‏ تصميم التجربة: عند التأكد من صحة النموذج» يكون بذلك قد تم تصميم التجربة. ولابد من 
تحديد مدة تشغيل المحاكاة إذ إنها تّعد جزءًا من هذه الخطوة. وهناك نوعان من الأهداف 
المهمة والمتناقضة وهما: الدقة والتكلفة. ومن الحكمة أيضًا تحديد الحالات النموذجية (مثل: 
المتوسط والوسيط للمتغيرات العشوائية)» والحالات الأفضل (مثل: التكلفة المنخفضة» والربح 
المرتفع)» بالإضافة إلى أسوأ حالة من السيناريوهات (مثل: التكلفة المرتفعة» والإيرادات 
المنخفضة)؛ حيث يساعد ذلك في إنشاء نطاقات متغيرات القرار والبيئة التي تعمل فيها كما 
يساعد أيضًا في تصحيح نموذج المحاكاة. 

0- إجراء التجربة: ويقتضي إجراء التجربة مسائل تتراوح من إنشاء الأرقام العشوائية وصولًا إلى عرض النتائج. 

1- تقييم النتائج: ينبغي تفسير النتائج. بالإضافة إلى الأدوات الإحصائية القياسية» كما يمكن أيضًا 
استخدام تحليلات الحساسية. 

۷- تنفيذ النتائج: إن تنفيذ المحاكاة مثله مثل أي تنفيذ آخرء فهو يتضمن نفس المشاكل التي 
يتضمنها أي تنفيذ آخر. ومع ذلكء فإن فرص النجاح في المحاكاة تكون أفضل نظرًا لأن المدير 
عادةً ما يكون مشاركًا في عملية المحاكاة أكثر من النماذج الأخرى؛ حيث تؤدي المستويات 
العليا من المشاركة الإدارية بشكل عام إلى مستويات أعلى من نجاح التنفيذ. 


ES‏ مشكلة واقعية 


| | إختبار النموذج |_| بناء نموذج 
.التحقق من صحتا المحاكاة 
4 ^ 


تغيير المشكلة الواقعية 











xe‏ تقييم نتائج تصميم وإجراء 
| النتائج H‏ التجارب H‏ التجارب 
33 $ 4 


E3 











شكل 17-5: عملية المحاكاة 


oM‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 














التحليلات التوجيهية: التحسين والمحاكاة 


وقد قدم كل من 8215 و(2009) 1550© بعض النصائح المفيدة حول ممارسات المحاكاة؛ حيث 
قاموا على سبيل المثالء بسرد المشاكل السبعة التالية باعتبارها الأخطاء الشائعة التي يرتكبها مصممو 
نماذج ا محاكاة. كما توفر القائمة. وإن لم تكن شاملة» اتجاهات عامة لمحترفي العمل بمشاريع المحاكاة. 
- التركيز على النموذج أكثر من التركيز على المشكلة. 
- توفير تقديرات للنقطة. 
- عدم معرفة وقت التوقف. 
- إعداد تقرير بما يريد العميل سماعه وليس ها تقوله نتائج النموذج. 
- عدم فهم الإحصاءات. 
- الخلط بين السبب والنتيجة. 
- الفشل في مطابقة الواقع. 

وفي مقال متابع» يتابع كل من äu Gibson (2009) Banks‏ مبادئ توجيهية إضافية, 
ينبغي الرجوع إليها في هذا المقال: 
analytics-magazine.org/spring-2009/205-software-solutions-the-abcs-of-‏ 


simulationpractice.html. 


أنواع المحاكاة: 
وكما رأيناء فإنه عندما تكون الدراسات التجريبية وتجريب الأنظمة الحقيقية باهظة الثمن أو 
مستحيلة في بعض الأحيان فإنه يتم استخدام المحاكاة والنمذجة؛ حيث تسمح لنا نماذج المحاكاة 
بالتحقق من مختلف السيناريوهات المثيرة للاهتمام قبل القيام بأي استثمار. وعمليات المحاكاة 
في الواقع» يتم فيها تعيين العمليات التي تحدث في العالم الحقيقي في نموذج المحاكاةء حيث يتكون 
النموذج من علاقات» وبالتالي معادلات تقدم جميعًا عمليات العام الحقيقي. وتعتمد نتائج 
نموذج ا محاكاة في هذه الحالة على مجموعة من المَعْلمات المعطاة للنموذج كمدخلات. 
وهناك العديد من نماذج المحاكاة مثل: محاكاة مونت كارلو 510ه0 22/104 أو نموذج 
الأحداث المنفصلة؛ أو نموذج العوامل القائمة, أو نموذج ديناميات النظام. ويُعد مستوى التجريد 
في المشكلة هو أحد العوامل التي تحدد نوع تقنية المحاكاة. وعادةً ما نُستخدم نماذج الأحداث 
المنفصلة والنماذج المعتمدة على العوامل لمستويات التجريد الوسطى أو المنخفضة. وبالإضافة إلى 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري OAV‏ 


الفصل السادس 


ذلك فإنه عادةً ما يؤخذ في الاعتبار العناصر الفردية مثل الأشخاص والأجزاء والمنتجات في نماذج 
المحاكاة: في حين أن ديناميات الأنظمة أكثر ملاءمة للتحليل الكلي. 
وسوف نقدم في القسم التالي» الأنواع الرئيسة من المحاكاة. وهي: المحاكاة الاحتماليةء وا محاكاة 
المعتمدة على الوقت والمستقلة عن الزمنء بالإضافة إلى المحاكاة المرئية. كما أن هناك العديد من 
تقنيات المحاكاة الأخرى مثل نمذجة ديناميات النظام» والنماذج القائمة على الوكيل. وكما ذكرنا آنقًاه 
فإن الهدف هنا هو تمكينك من إدراك إمكانات بعض هذه التقنيات بدلا من جعلك خبيرًا في استخدامها. 
المحاكاة الاحتمالية: في المحاكاة الاحتماليةء يكون هناك واحد أو أكثر من المتغيرات المستقلة 
(مثل: الطلب في مشكلة جرد) هي الاحتمالية. وهذه المتغيرات تتبع توزيعات احتمالية معينة, 
والتي قد تكون إما توزيعات منفصلة أو مستمرة: 
- التوزيعات المنفصلة: وتنطوي على حالة مع عدد محدود من الأحداث (أو المتغيرات) والتي قد 
تأخذ عددًا محدودًا فقط من القيم. 
- التوزيعات المستمرة: وهي حالات ذات عدد غير محدود من الأحداث المحتملة والتي تتبع 
وظائف الكثافةء مثل التوزيع الطبيعي. 
ويعرض الجدول (2-1) كلا نوعي التوزيعات. 


جدول 0-5: التوزيعات المنفصلة مقابل الاحتمالية ا لمستمرة 


الطلب اليومي | الاحتمالية ا منفصلة الاحتمالية المستمرة 
y ^‏ يتوزع الطلب اليومي توزيعًا طبيعيًا متوسط ١‏ وانحراف 
معياري ۱,۲. 
1 0 
m y‏ 
-YO ^‏ 
m q‏ 














المحاكاة المعتمدة على الوقت في مقابل المحاكاة المستقلة عن الوقت: يشير مصطلح الزمن 
المستقل إلى حالة لا يهم فيها معرفة وقت وقوع الحدث بالضبط. فعلى سبيل المثالء قد يكون 
لدينا علم أن الطلب على منتج معين عبارة عن ثلاث وحدات في اليوم: غير أننا لا نهتم متى يتم 


OM‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 




















التحليلات التوجيهية: التحسين والمحاكاة 


طلب العنصر خلال اليوم. وف بعض الحالات» قد لا يكون الوقت عاملًا في المحاكاة على الإطلاق» 
كما هو الحال عند تصميم التحكم في المصانع بطريقة ثابتة. ومع ذلك فإنه في مشاكل خط 
الانتظار التي تنطبق على التجارة الإلكترونية, من الضروري معرفة الوقت الدقيق للوصول (لمعرفة 
ما إذا كان العميل سيضطر إلى الانتظار). وهذا الموقف ينطبق على الوقت المحدد. 


:Monte Carlo 3/j5 C355 8505‏ 
عادةً ما يتم استخدام أحد النوعين التاليين من المحاكاة الاحتمالية في معظم مشاكل القرارات 
التجارية. وتّعد محاكاة مونت كارلو هي طريقة المحاكاة الأكثر شيوعًا لمشاكل قرارات العمل. وتبدأ 
هذه الطريقة عادةً بتصميم نموذج لمشكلة القرار دون الحاجة إلى أخذ عدم التأكد في الاعتبار لأي 
متغيرات: ثم ندرك أن هناك مَعْلمات أو متغيرات معينة تكون غير مؤكدة أو تتبع توزيع احتمالية 
مفترض أو تقديريء ويعتمد هذا التقدير على تحليل البيانات السابقةء وعندئذ نبدأ بتشغيل تجارب 
أخذ العينات. وتتكون تجارب أخذ العينات الجارية من إنشاء قيم عشوائية من المَعُلمات غير المؤكدة 
ومن ثم قيم الحوسبة للمتغيرات التي تتأثر بمثل هذه المَعْلمات أو المتغيرات؛ حيث تصل هذه التجارب 
الخاصة بأخذ العينات بشكل أساهي إلى حل نفس النموذج مئات أو آلاف المرات. وبعد ذلكء يمكننا 
تحليل سلوك هذه المتغيرات التابعة أو متغيرات الأداء من خلال دراسة التوزيعات الإحصائية الخاصة 
بهم. وقد استخدمت هذه الطريقة في محاكاة النظم الفيزيائية وكذلك نظم الأعمال. ويوفر موقع 
Ls, (http://www.palisade.com/risk/monte carlo simulation.asp) Palisade.com‏ 
تعليميًا عامًّا وجيدًا لطريقة محاكاة مونت كارلو. كما يقوم الموقع بتسويق أداة تسمى 111516©: وهي 
عبارة عن برنامج محاكاة شائع يعتمد على جداول بيانات مونت كارلو. كما يوجد برنامج آخر شائع في 
هذه الفئة وهو 8211 015]21: والذي يتم تسويقه حاليًا بواسطة „Oracle as Oracle Crystal Ball‏ 
وبالطبع» فإنه يمكن أيضًا إنشاء تجارب مونت كارلو وتشغيلها في جدول بيانات 8:01 دون استخدام 
أي برنامج إضافي مثل البرنامجَين اللدّين ذكرا آنقًا. غير أن هذه الأدوات تجعله أكثر ملاءمة لتشغيل 
مثل هذه التجارب في النماذج القائمة على 155661. الجدير بالذكر أن نماذج محاكاة مونت كارلو قد 
تم استخدامها في العديد من التطبيقات التجارية. ومن الأمثلة على ذلك استخدام شركة بروكتور 
Gamble) |] l5‏ 8 2206162) لهذه النماذج لتحديد مخاطر الصرف الأجنبي؛ واستخدام شركة 
Lilly‏ للنموذج لتحديد القدرة النباتية المثلى؛ وكذلك شركة أبو ظبي للمياه والكهرباء والتي استخدمت 
1351© للتنبؤ بالطلب على المياه في أبو ظبي؛ بالإضافة إلى الآلاف من دراسات حالات واقعية أخرى. 

ويشتمل كل موقع من مواقع شركات برامج المحاكاة على العديد من قصص النجاح. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري on‏ 


الفصل السادس 


محاكاة الحدث المنفصل: 
تشير محاكاة الحدث المنفصل إلى بناء نموذج لنظام يتم فيه دراسة التفاعل بين الكيانات 
ال مختلفة. وأبسط مثال على ذلك هو مثال المتجر الذي يتألف من خادم وعملاء. ويمكننا تقدير 
متوسط أداء النظام: ووقت الانتظارء وعدد العملاء المنتظرين: وما إلى ذلك من خلال نمذجة 
العملاء الذين يصلون إلى معدلات مختلفة: والخادم الذي يخدم بمعدلات مختلفة. ومثل هذه 
الأنظمة يتم النظر إليها باعتبارها مجموعات من العملاءء وقوائم انتظارء وخوادم. كما يوجد 
الآلاف من التطبيقات الموثقة لنماذج محاكاة الأحداث المنفصلة في الهندسة: والأعمال التجارية, 
وما إلى ذلك. وقد كانت أدوات بناء نماذج محاكاة الحدث المنفصلة موجودة منذ فترة طويلةء غير 
أنها تطورت للاستفادة من التطورات في القدرات الرسومية لبناء وفهم نتائج مثل هذه النماذج 
للمحاكاة. وفي القسم التالي سوف نناقش هذه الطريقة الخاصة بالنمذجة. وتعرض الحالة العملية 
(6-7) مثالا على استخدام هذه المحاكاة في تحليل تعقيدات سلسلة التوريد التي تستخدم محاكاة 
مرئية والتي سيتم وصفها في القسم التالي. 
حالة عملية ۸-٦‏ 
استخدام شركة كوزان («ه5٠٥)‏ المحاكاة من أجل تحسين سلسلة التوريد للطاقة 
050 هي مجموعة شركات مقرها البرازيل وتعمل على مستوى العالمء وأحد 
أنشطتها الرئيسة هي زراعة ومعالجة قصب السكر. وقد أصبح قصب السكر الآن 
مصدرًا رئِيسا للإيثانول» فضلًا عن أنه المصدر الرئيس للسكرء كما أنه مكون رئيس في 
الطاقة المتجددة. وقد أصبح الإيثانول «Cosan 4$4J fS (bU‏ بسبب تزايد الطلب 
على الطاقة المتجددة. حيث يقوم الإيثانول الآن بتشغيل مصفاتين بالإضافة إلى ١8‏ 
مصنع إنتاج» وملايين الهكتارات 16613565 من مزارع قصب السكر. ووفقًا للبيانات 
الحديثة فقد عالجت الشركة أكثر من ٤٤‏ مليون طن من قصب السكرء كما أنتجت أكثر 
من ,1 مليار لتر من الإيثانولء بالإضافة إلى ٠,۳‏ مليون طن من السكر. وكما يتبينء فإن 
عمليات هذا النطاق تؤدي إلى سلاسل التوريد المعقدة. ولذلك؛ فقد Qa cal‏ فريق 
الإمدادات تقديم توصيات إلى الإدارة العليا من أجل: 
- تحديد العدد الأمثل من الشاحنات المطلوبة في أسطول يُُستخدم لنقل قصب 
السكر إلى معامل التصنيع من أجل الحفاظ على رأس المال. 
- تقديم اقتراح لكيفية زيادة قدرة قصب السكر الفعلية التي يتم إمداد مصانع السكر بها. 


os.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


- تحديد مشاكل عنق الزجاجة المتعلقة بالإنتاج لوضع حلول لها من أجل تحسين 
تدقق قصب السكر. 

المنهجية / الحل: 

قام فريق الإمدادات بالعمل من خلال برمجيات 51210 ومن e‏ قام الفريق ببناء 
نموذج محاكاة مركب لسلس لة توريد شركة 00538 فيما يتعلق بهذه المشاكل. وتبعًا 
للموجز الذي قدمته برمجيات 511010: فإنه: ”على مدار ثلاثة أشهرء قام المهندسون 
المستأجرون حديئًا بجمع البيانات المتعلقة بهذا المجال» كما تلقوا تدرييًا عمليًا ومساعدة 
في النمذجة "Paragon Consulting of San Palo (a‏ 

ولنمذجة العمليات الزراعية لتحليل رحلة ما بعد حصاد قصب السكر حتى يصل 
إلى مصانع الإنتاج» فقد شملت أهداف النموذج تفاصيل الأسطول الناقل لقصب السكر 
Unity Costa Pinto |J] (ll e‏ كما شملت أيضًا القدرة الفعلية لاستقبال مصانع 
سكر القصبء والاختناقات: بالإضافة إلى نقاط التحسين في تدفق ‏ 0071 (قطع التنزيل) 
من قصب السكرء وهكذا. وتتمثل مَعْلمات النموذج فيما يلي: 

- متغيرات المدخلات: 'ا. 

- متغيرات الإنتاج: 89. 

- المتغيرات الإضافية: .٩۲‏ 

- كيانات متغیرة: ۸. 

- جداول المدخلات: 19. 

- أيام المحاكاة: "6٠‏ (الموسم الأول). 

- عدد الكيانات: ٠١( ١7‏ أنواع مركبة حصاد لنقل قصب السكر). 

النتائج / الفوائد: 

وقد قدمت هذه التحليلات التي نتجت عن نماذج 515710 فكرة جيدة عن خطر 
التشغيل خلال فترة Gg YE‏ بسبب الشكوك المختلفة. وقد تمكنت الشركة من اتخاذ 
قرارات أفضل وتوفير أكثر من $0٠٠,٠٠١‏ من هذه الجهود الخاصة بالنمذجة وحدها 
فقطء من خلال تحليل الاختناقات المختلفة وطرق التخفيف من هذه السيناريوهات. 

أسئلة للمناقشة: 

-١‏ ما نوع الاضطرابات في سلسلة التوريد التي يمكن أن تحدث في نقل قصب السكر 
من الحقل إلى مصانع الإنتاج لتطوير السكر والإيثانول؟ 

ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 0۹۱ 


الفصل السادس 


'- ما هي الأنواع المتقدمة من التخطيط والتنبؤ التي قد تكون مفيدة في تخفيف 
مثل هذا الاضطراب؟ 

ما الذي يمكن أن نتعلمه من هذه الحالة العملية؟ 

هذه القصة القصيرة للحالة العملية التي نحن بصددها توضح قيمة تطبيق المحاكاة 
على أحد المشاكل والتي قد يصعب معها بناء نموذج التحسين. ومن خلال دمج نموذج 
محاكاة الحدث المنفرد والمحاكاة التفاعلية ا مرئية (1715)» يمكن تصور تأثير الانقطاعات 
à‏ سلسلة التوريد يسبب فشل الأسظولء والوقت غير المتوقع في هذا الوضعء وغير ذلك» 
ومن ثم التوصل إلى التصحيحات المخطط لها 
Sources: Compiled from Wikipedia contributors, Cosan, Wikipedia, The Free‏ 
Encyclopedia, https://en.wikipedia.org/w/index.php?title-Cosan&oldid-713298536‏ 
(accessed July 10, 2016); Agricultural Operations Simulation Case Study: Cosan,‏ 
http://www.simio.com/case-studies/Cosan-agricultural-logistics-simulation-‏ 
software-case-study/agricultural-simulation-software- case-study-video-cosan.php,‏ 
(accessed July 2016); Cosan Case Study: Optimizing agricultural logistics operations,‏ 
http://www.simio.com/case-studies/Cosan-agricultural-logistics-simulation-‏ 


software-case-study/index.php, (accessed July 2016). 


أسئلة مراجعة على القسم "-9: 

-١‏ اذكر خصائص المحاكاة. 

۲- اذكر مزايا وعيوب اممحاكاة. 

-٠"‏ اذكر مع الشرح خطوات منهجية المحاكاة. 
-٤‏ اذكر مع الشرح أنواع المحاكاة. 


٠١-5‏ المحاكاة التفاعلية المرئية: 


فيما يلي سنقوم بفحص الطرق التي ثبين صورة صانع القرار أثناء اتخاذ القرار في العمل. فهو 
يعمل من خلال سيناريوهات لشتى البدائل. حيث تتغلب هذه الطرق القوية على بعض أوجه 
القصور في الطرق التقليدية كما تساعد على بناء الثقة في الحل الذي تم التوصل إليه نظرًا لإمكانية 
تصور هذه الطرق بشكل مباشر. 


osy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


عيوب المحاكاة التقليدية: 

تعد المحاكاة طريقة راسخة ومفيدة. بالإضافة إلى أنها وصفيةء وتعتمد على الرياضيات 
لاكتساب نظرة ثاقبة في حالات اتخاذ القرار المعقدة. وعلى الرغم من كل ما ذكرء إلا أن الممحاكاة 
عادةً لا تسمح لصانعي القرار برؤية كيفية تطور حل مشكلة معقدة (مضغوطة)» بالإضافة إلى أن 
صانعي القرار لا يمكنهم التفاعل مع المحاكاة (والتي ستكون مفيدة لأغراض التدريب والتدريس). 
وبشكل عام: فإن المحاكاة تشير إلى النتائج الإحصائية في نهاية مجموعة من التجارب. وبالتالي» 
فإن صانعي القرار ليسوا جزءًا مكملًا في تطوير المحاكاة والتجريبء ولا يمكن استخدام خبراتهم 
وحكمهم بشكل مباشر. فإذا كانت نتائج المحاكاة لا تتطابق مع حدس أو حكم صانع القرارء فإنه 
من الممكن حدوث فجوة ثقة في النتائج. 
المحاكاة التفاعلية المرئية: 

إن المحاكاة التفاعلية المرئية (7715). والتي تُعرف أيضًا باسم النمذجة التفاعلية المرئية (VIM)‏ 
وحل المشاكل التفاعلي المرني» هي طريقة محاكاة تتيح لصانعي القرار رؤية ما يفعله النموذج 
وكيف :يتفاعل مع القرازات المففذة تحسب ماايقخ gla dsl oda Cadiz a db go‏ 
كبير في تحليل العمليات في عدة مجالات مثل سلسلة التوريد والرعاية الصحية: حتى يتمكن 
الممستخدم من توظيف معرفته لتحديد وتجربة إستراتيجيات القرارات المختلفة أثناء التفاعل مع 
النموذج. ومن الممكن حدوث التعلم المُعزز حول مشكلة وتأثير البدائل التي تم اختبارها. 

ولعرض تأثير القرارات الإدارية ا مختلفةء فإن ا محاكاة التفاعلية المرئية (۷15) تستخدم شاشات 
الرسوم المتحركة للحاسب؛ حيث تختلف هذه الشاشات عن الرسومات العادية في أنها تتيح 
للمستخدم ضبط عملية صنع القرار ورؤية نتائج التدخل. ويُعد النموذج ال مرف رسمًا بيانيًا يُستخدم 
باعتباره جزءًا لا يتجزأ من عملية صنع القرار أو حل ابمشاكلء وليس مجرد جهاز اتصال فقطء حيث 
يستجيب بعض الأشخاص للعروض الرسومية بشكل أفضل من غيرهم. كما يستطيع هذا النوع من 
التفاعل مساعدة المديرين في دراسة موقف اتخاذ القرار. 

ويمكن للمحاكاة التفاعلية المرئية (1715) أن توضح أنظمة ثابتة أو حركية؛ حيث تعرض النماذج 
الثابتة صورة مرئية لنتيجة بديل واحد في كل مرة. أما النماذج الحركية فإنها تعرض الأنظمة التي 
تتطور مع مرور الوقت» ويتم توضيح التطور عن طريق الرسوم المتحركة. وقد ارتبطت أحدث 
تقنيات المحاكاة المرئية بمفهوم الواقع الافتراضيء حيث يتم إنشاء عالم اصطناعي لأغراض متعددة, 
من التدريب إلى الترفيه إلى عرض البيانات في مشهد اصطناعي. فعلى سبيل المثال» يقوم الجيش 
الأمريكي باستخدام أنظمة ۷18 حتى تتمكن القوات البرية من الإلمام بالتضاريس أو المدينة من أجل 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري وك 


الفصل السادس 


توجيه نفسها بسرعة كبيرة. كما يستخدم الطيارون 5715 من أجل التعرف على الأهداف من خلال 
محاكاة عمليات الهجوم. وبالإضافة إلى ذلكء فإن برنامج 115 قد يتضمن أيضًا إحداثيات 15©. 
النماذج التفاعلية المرئية و1255: 
استخدمت النماذج التفاعلية المرئية في أنظمة دعم القرار في العديد من قرارات إدارة 
العمليات. وتتكون الطريقة من تحضير (مثل تحضير مضخة مياه) نموذج تفاعلي مرفي لمصنع (أو 
شركة) بوضعه الحالي» ومن تم يعمل النموذج بسرعة على الحاسب» مما يسمح للمديرين مراقبة 
احتمالات كيفية عمل المصنع في المستقبل. 
وخير مثال على النماذج التفاعلية المرئية (VIM)‏ هو إدارة خط الانتظار (الطابور). وعادةً 
ما يقوم برنامج مثل أنظمة دعم القرار بحساب عدة مقاييس لأداء بدائل القرار المختلفة (مثل: 
وقت الانتظار في النظام). تتطلب مشالكل الطابور استخدام المحاكاة؛ حيث ممكن للنماذج 
التفاعلية المرئية (17121) عند تشغيل المحاكاة عرض حجم الطابور أثناء تغييره كما يمكنها أيضًا 
تقديم إجابات بيانية حول ما إذا كانت الأسئلة تتعلق بالتغيرات التي تحدث في متغيرات الإدخال. 
وتقدم الحالة العملية (9-1) مثالًا لمحاكاة مرئية استخدمت بغرض استكشاف تطبيقات تقنية 
(RFID) goll olsy Laos‏ في إعداد التصنيع. 
كما يمكن أيضًا دمج تقنيتي النماذج التفاعلية المرئية والذكاء الاصطناعي؛ حيث يضيف دمج 
كلا التقنيتين Bas‏ قدرات تتراوح من القدرة على بناء الأنظمة بيانيًا إلى التعلم عن ديناميكيات 
النظام. فهذه الأنظمة - لاسيما تلك التي تم تطويرها للعسكرية وصناعة ألعاب الفيديو - لديها 
أساليب تفكير تجعلها قادرة على التصرف بمستوى ذكاء عالٍ نسبيًا في تفاعلاتها مع المستخدمين. 
حالة عملية 9-5 
تحسين قرارات جدولة محل العمل من خلال الترددات اللاسلكية (11711: التقييم 
القائم على المحاكاة 
يسعى مزود خدمات التصنيع الخاص بالمكونات البصرية والكهروميكانيكية المعقدة 
إلى اكتساب الكفاءة في قرار الجدولة الخاص بمحل عمله نظرًا لمعاناة عمليات المتجر 
الحالية من بعض المشاكل: 
- عدم وجود نظام للتسجيل في حالة وصول عناصر عملية 10:14 (11712) فعليًا 
إلى محطات العمل أو عند مغادرتها محطات تشغيل العمل بالإضافة إلى مدة بقاء 
5 الفعلية في كل محطة عمل. 
- عدم قدرة النظام الحالي على مراقبة أو متابعة حركة كل ۷1۴ في خط الإنتاج بشكل فوري. 


osé‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


ونتيجة لذلك» فإن الشركة تواجه مشكلتين رئيستين في هذا الخط الإنتاجي» وهي: 
مشكلة التراكمات المرتفعة ومشكلة تكاليف ارتفاع العمل الإضافي لتلبية الطلب. 
وبالإضافة إلى ذلكء فإن المنبع لا يمكنه الاستجابة بسرعة كافية للحوادث غير المتوقعة 
مثل التغيرات في الطلب أو نقص المواد. كما أنه لا يمكنه مراجعة الجداول بطريقة فعالة 
من حيث التكلفة. وتقوم الشركة بدراسة تنفيذ 11:17 على خط الإنتاج. غير أنها 
بالرغم من ذلكء لا تعرف ما إذا كانت ستتحمل هذه النفقات الرئيسة من أجل إضافة 
رقائق RFID‏ على صناديق الإنتاج» وتثبيت قارتات (27811 في جميع أنحاء خط الإنتاج» 
وبالتالي بكل تأكيد ستؤدي أنظمة معالجة هذه المعلومات إلى عدة مكاسب حقيقية. 
ولذلك؛ فإن هناك سؤالًا واحدًا وهو لاستكشاف أي التغيرات الجديدة في جدولة الإنتاج 
التي من ام محتمل أن تننج عن الاستثمار في بنية ۸۴15 التحتية. 

امنهجية: 

نظرًا لآن استكشاف إدخال أي نظام جديد في نظام الإنتاج المادي من الممكن أن 
يكون مكلقًا للغاية أو حتى تخريبيٌاء فقد تم تطوير نموذج محاكاة للحدث منفصل 
لفحص كيف gls (tracking) oiai) gaai us‏ من خلال ۸۴1 أن يقوم بتسهيل 
أنشطة جدولة إنتاج ورشة العمل. وقد تم اقتراح قاعدة جدولة 1/85 تعتمد على الرؤية 
وتستخدم أنظمة التتبع الفورية لتعقب أجزاء ومكونات 117185 بالإضافة إلى المواد الخام 
في عمليات الورش (1001-م500). وقد تم تطبيق نهج المحاكاة من أجل فحص فائدة 
قاعدة 1785 مقابل قواعد الجدولة الكلاسيكية: الأسبق في بدايات وأقدم قواعد موعد 
الاستحقاق. وقد تم استخدام برامج 518110 لتطوير نموذج المحاكاة. وبرامج SIMIO‏ 
هي عبارة عن مجموعة من برامج محاكاة النماذج ثلاثية الأبعاد والتي تستخدم أسلوبًا 
موجهًا نحو النمذجة: وقد تم استخدام هذه البرامج مؤخرًا في العديد من المجالات مثل 
المصانع وسلاسل التوريد والرعاية الصحية والمطارات وأنظمة الخدمات. 

ويعرض الشكل (1-5) لقطة شاشة من لوحة واجهة 513110 لهذا الخط الإنتاجي. 
حيث تتضمن تقديرات المَعُلمات ال ممستخدمة للحالة الأولية في نموذج المحاكاة كلّا من 
الطلبات والتوقعات الأسبوعيةء بالإضافة إلى تدفق العمليةء وعدد محطات العملء وعدد 
مشغاي الطوابق» ووقت التشغيل في كل محطة عمل. وبالإضافة إلى ذلك. فإنه يتم 
تقدير مَعْلَمات بعض بيانات الإدخال مثل وقت وضع علامات ۸۴1۲ أو وقت استرجاع 
المعلومات» أو وقت تحديث النظام من خلال دراسة تجريبية ومن خبراء اطموضوع. 
ويوضح الشكل )١15-5(‏ الرؤية العملية لنموذج المحاكاة حيث يتم تنفيذ أوامر محاكاة 
محددة وترميزها. كما يقدم كلا الشكلين (10-7) و(17-5) عرضًا للتقرير القياسي 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 040 


الفصل السادس 


وتقرير الشبكة المحورية لنموذج المحاكاة. حيث يوفر كل من التقرير القياسي وشكل 
الشبكة المحورية طريقةً سريعة جدًا للعثور على نتائج إحصائية محددة المتوسط. 
أو النسبة المئوية» أو الإجمالي أو الحد الأقصىء أو الحد الأدنى لقيم المتغيرات التي تم 
تعيينها والتقاطها كمخرج من نموذج المحاكاة. 





e 
væ 


epp] 


"i 





شكل 15-5: عرض عملية نموذج المحاكاة 


0۹1 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








التحليلات التوجيهية: التحسين والمحاكاة 





شكل 10-5: عرض تقرير قياسي 





شكل 15-5: تقرير شبكة محورية من تشغيل SIMIO‏ 


النتائج: 
تشير نتائج المحاكاة إلى أن الأداء الذي يَنتّجِ عن قاعدة الجدولة المعتمدة على 721:10 
يُعد أفضل إذا ما قورن بقواعد الجدولة التقليدية فيما يتعلق بوقت المعالجةء ووقت 


ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري oV‏ 


الفصل السادس 


الإنتاج» واستخدام الموارد» والتراكم: والإنتاجية. فإن الشركة يمكنها أخذ هذه المكاسب 
الإنتاجية ومن تم تقوم بتحليل التكلفة / الفائدة في اتخاذ قرارات الاستثمار النهائية. 

أسئلة للمناقشة: 

-١‏ ما هي الأساليب الأخرى التي يمكن اتخاذها لتحليل قرارات الاستثمار في الحالات 
التي تشبه هذه الحالة؟ 

۲- كيف هكن توفير الوقت في حالة قدرة رقاقة 1715 على معرفة الموقع الدقيق 
للمنتج قيد التشغيل؟ 

-٠‏ ابحث لتتعرف على تطبيقات أجهزة استشعار ۸۴1۲ في أماكن أخرىء مع 
توضيح أي منها تجده أكثر إثارة للاهتمام. 
Source: Based on Chongwatpol, J., & Sharda, R. (2013). RFID-enabled track and‏ 


traceability in job-shop scheduling environment. European Journal of Operational 


Research, 227(3), 453- 463, http://dx.doi.org/10.1016/j.ejor.2013.01.009. 
برامج المحاكاة:‎ 


هناك المئات من حزم المحاكاة التي تتوفر لمجموعة من حالات اتخاذ القرار dae gil‏ حيث 
يتم تشغيل الكثير منها كنظم على شبكة الإنترنت. وتقوم ORMS Today‏ بنشر مراجعة دورية 
لبرامج المحاكاة. وأحد هذه المراجعات الحديثة (اعتبارًا من أكتوبر orms- se els (Y- VO‏ 
Quai (Y* VV so» (à 8b JI —:2) today.org/surveys/Simulation/Simulation.html‏ 
حزم برامج الحاسب كلا من: i‏ 
(Lumina Decision Systems, lumina.com) Analytica -‏ 
qls) Excel add-ins Crystal Ball -‏ تباع الآن من قبل Oracle as Oracle Crystal Ball,‏ 
-(oracle.com‏ 
-(Palisade Corp., palisade.com) (RISK -‏ 
85b juS is) eo3 ga» $25 (soldby Rockwell Intl., arenasimulation.com) Arena -‏ 
الأحداث المنفصلة. 
Simi -‏ (i0.comصiء)»‏ وهو برنامج للمحاكاة التفاعلية اممرئية (۷15) سهل الاستخدام تم 
تطويره من قبل مطوري برنامج 4۲٠٠4‏ الأصليين. وبالإضافة إلى ذلك فهناك: 


OSA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


»)extendsim.com( ExtendSim -‏ وهو برنامج محاكاة تفاعلية مرئية (۷15) آخر متمیز کما 
أن له شهرة واسعة. 

- 12015 وتمتلكه 545: وهو عبارة عن حزمة برمجية تحليلية رسومية تنطوي أيضًا على المحاكاة كأحد مكوناتها. 
وللحصول على معلومات حول برامج ا محاكاة يمكنك مراجعة مجتمع النمذجة والمحاكاة 

الدولية (5©5.018) ومسح البرنامج السنوي في -(ormstoday.com) ORMS Today‏ 

أسئلة مراجعة على القسم :٠١-5‏ 

-١‏ عرف ال محاكاة المرئية مع المقارنة بينها وبين المحاكاة العادية. 

۲- قم بوصف مميزات المحاكاة التفاعلية ال مرئية (۷15) (أي: النمذجة التفاعلية ا مرئية (VIM‏ 
التي تجعلها جذابة لصناع القرار. 

- كيف يمكن استخدام المحاكاة التفاعلية المرئية (1715) في إدارة العمليات؟ 

ع- كيف يشبه فيلم الرسوم المتحركة SVIS Guh‏ 


تلخيص لأهم نقاط الفصل: 
- تلعب النماذج - متعددة الأنواع - دورًا رئِيسَا في أنظمة دعم القرار لأنها ُستخدم لوصف 
مواقف حقيقية لصنع القرار. 


- يمكن أن تكون النماذج ثابتة (أي لقطة مفردة لوقف ما) أو متحركة (أي فترة متعددة). 

- يتم إجراء التحليل تحت درجة تأكد مفترضة (والذي يعتبر مقبولًا بنسبة كبيرة) أو الخطر أو 
عدم التأكد (والذي يعتبر مقبولًا بنسبة ضئيلة). 

- يعرض المخططات البيانية التأثيرية بيانيًا العلاقات الداخلية لنموذج ما. ويمكن استخدامها 
لتعزيز استخدام تقنية جداول البيانات. 

- يوجد لدى جداول البيانات العديد من القدرات» ما في ذلك تحليل ”ماذا - لو“» والبحث عن 
الهدف» والبرمجةء وإدارة قواعد البيانات» والوصول للوضع الأمثلء وا محاكاة. 

- يمكن لكل من جداول القرار وأشجار القرار أن تقوم بنمذجة وحل مشاكل بسيطة لصنع القرار. 

- تعتبر البرمجة الرياضية منهجًا مهما للوصول للوضع الأمثل. 

- تعتبر البرمجة الخطية هي أكثر طرق البرمجة الرياضية انتشارًا. فهي تحاول تحقيق التخصيص 
الأمثل للموارد المحدودة تحت قيود تنظيمية. 

- تعتبر الأجزاء الرئيسة لنموذج البرمجة الخطية هي دالة الهدفء ومتغيرات القرارء والقيود. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري لكك 


الفصل السادس 


- تعتبر حل مشاكل صنع القرار متعدد المعايير صعبًا ولكن ليس مستحيلا. 

- ”ماذا - لو“ و”البحث عن الهدف“ هما أكثر الطرق انتشارًا لتحليل الحساسية. 

- تشتمل العديد من أدوات تطوير أنظمة دعم القرار بداخلها على نماذج كمية (كنماذج مالية أو 
إحصائية) أو يمكنها التعامل بسهولة مع مثل هذه النماذج. 

- تعتبر المحاكاة نهج أنظمة دعم القرار واسع الاستخدام؛ إذ تتضمن تجربة ذات نموذج يمثل 
موققًا حقيقيًا لصنع القرار. 

- يمكن للمحاكاة التعامل مع حالات أكثر تعقيدًا من التحسينء ولكنها لا تضمن حلا أمثل. 

- توجد عدة طرق مختلفة للمحاكاةء ويعد بعضها مهما في اتخاذ القرار ومنها محاكاة مونت كارلو 
ومحاكاة الحدث المنفصل. 

- يسمح ]1715/1713 لصانع القرار بالتفاعل المباشر مع أي نموذج ويعرض النتائج بأسلوب سهل الفهم. 


مصطلحات أساسية: 
التأكد. 
تحليل القرار. 
جدول القرار. 
abàll 8,‏ 


متغير القرار. 





نماذج متحركة. 
المسح البيئي والتحليل. 
Me‏ 


محاكاة الحدث المنفصل. 





البحث عن الهدف. 


المخطط البياني التأثيري. 


متغير النتيجة ابلتوسط. 


البرمجة الخطية (2.آ). 


البرمجة الرياضية. 


متخاكاة حوفت كارلة. 


تحليل متعدد الأبعاد 
(نمذجة). 


النماذج الثابتة. 





أهداف متعددة. 


الحل الأمثل. 


ahal gies 


alos‏ الخساسيةة 





عدم التأكد. 

متغير غير قابل 
النمذجة التفاعلية 
XVIM) 45,‏ 
المحاكاة التفاعلية 
المرئية (1715). 


ales‏ قاذ دلوت 


التوقع. 


المحاكاة. 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





























التحليلات التوجيهية: التحسين والمحاكاة 


أسئلة للمناقشة: 

-١‏ كيف ترتبط التحليلات التوجيهية بكل من التحليلات الوصفية والتنبؤية؟ 

-Y‏ اشرح الاختلافات بين النماذج الثابتة والمتحركة. وكيف ممكن استنباط أحدهما من الآخر؟ 

ls -Y‏ هو الفرق بين النهج التفاؤلي والنهج التشاؤمي في صنع القرار تحت درجة عدم التأكد المفترضة؟ 

ع- اشرح لماذا يتضمن حل المشاكل تحت درجة عدم التأكد أحيانًا افتراض أن المشكلة يجب أن 
يتم حلها تحت شروط الخطر. 

0- يحتمل أن يكون 1:61 هو برنامج جداول البيانات الأكثر انتشارًا بالنسبة لأجهزة الحاسب 
الشخصية: لماذا؟ وما الذي يمكننا القيام به مع هذه الحزمة لجعلها جذابة جدًّا لجهود النمذجة؟ 

1- اشرح كيفية عمل أشجار القرار. وكيف يمكن حل مشكلة معقدة باستخدام شجرة القرار؟ 

۷- اشرح كيف يكن للبرمجة الخطية حل مشاكل التخصيص. 

۸- ما هي مزايا وعيوب استخدام حزمة جداول البيانات لإنشاء وحل نماذج 15؟ 

SLP e3U ما هي مزايا وعيوب استخدام حزمة البرمجة الخطية لإنشاء وحل‎ -٩ 

-٠‏ ماهو الفرق بين تحليل القرار مع هدف واحد وتحليل القرار مع أهداف متعددة 

(أي المعايير)؟ اشرح الصعوبات التي قد تظهر عند تحليل الأهداف المتعددة. 

-١‏ اشرح عمليًا كيف يمكن ظهور أهداف متعددة. 

۲- قارن بين تحليلي ”ماذا - لو“ و”البحث عن الهدف؟. 

۳- قم بوصف العملية العامة للمحاكاة. 

-٤‏ اذكر بعض المزايا الرئيسة للمحاكاة فوق التحسين والعكس. 

0- يمكن اعتبار العديد من ألعاب الحاسب محاكاة مرئية» اشرح لاذا. 

17- اشرح بلاذا تكون 7715 مفيدة بشكل خاص في تنفيذ التوصيات المشتقة من أجهزة الحاسب. 

تمارين - شبكة جامعة تيراداتا latg (TUN)‏ من التمارين اليدوية: 

-١‏ قم باستكشاف teradatauniversitynetwork.com‏ وحدد كيف يتم استخدام النماذج في 
حالات ذكاء الأعمال والأوراق. 

۲- قم بإنشاء نماذج جداول البيانات المعروضة في الشكلين (2-5) £05( 
-١‏ ما هو تأثير تغير معدل الفائدة من 8* إلى *٠١‏ في نموذج جدول البيانات المعروض في الشكل (9-5)؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري My‏ 


الفصل السادس 


'- بالنسبة للنموذج الأصلي في الشكل (8-7). ما هو معدل الفائدة المطلوب لتخفيض الدفعات 
الشهرية بنسبة 977١‏ وما هو التغير في مبلغ القرض الذي سيكون له نفس التأثير؟ 

- في جدول البيانات المعروض في الشكل (6-1). ما هو تأثير الدفع المقدم بمبلغ ٠٠١‏ دولار كل 
شهر؟ ما هو الدفع المقدم الضروري لسداد القرض في ١0‏ عامًا بدلا من "١‏ عامًا؟ 


"- قم بحل مشكلة مزيج المنتجات )M81(‏ التي تم وصفها في هذا الفصل؛ باستخدام :50176 Excel's‏ 


أو نسحة الطالب من برنامج 501765 1.5 Lindo Js‏ حيث يتاح 1200.آ مj Lindo‏ 
Systems, Inc‏ على موقع 11000.603: وكذلك يتوفر غيره - ابحث في الويب. قم باختبار 
تقارير الحل (المخرجات) للإجابات وتقرير الحساسية. هل حصلت على نفس النتائج المذكورة 
في هذا الفصل؟ جرب تحليل الحساسية المشار إليه في الفصل وه و تخفيض الجانب الأمن 
من القيود التسويقية 00-8 بمقدار وحدة واحدة, أي من ٠٠١‏ إلى 119. ماذا يحدث للحل 
عندما تقوم بحل المشكلة بعد هذا التعديل؟ قم بإزالة قيد 00-8 الأدنى تمامًا (مكن عمل 
ذلك بسهولة إما بحذفه في :©5017 أو جعل الحد الأدنى صفرًا) ثم قم بإعادة حل المشكلة. ماذا 
يحدث؟ باستخدام الصيغة الأصليةء حاول تعديل معاملات دالة الهدف وانظر ماذا يحدث. 


ع- عبر البحث في الويب قم بفحص كيفية استخدام النماذج وحلولها بواسطة إدارة الأمن الوطني 


الأمريكي في ”الحرب ضد الإرهاب“. قم garis LÉT‏ كيفية استخدام الحكومات أو الهيئات 
الحكومية الأخرى للنماذج في مهامها. 


0- هذه المشكلة مساهمة من د. 11711508 111 من جامعة أوكلاهوما الحكومية. 


لقد ضرب الجفاف مؤخرًا المزارعين بشدة. تأكل الأبقار الذرة الحلوة. 

أنت مهتم بإعداد خطة تغذية للأسبوع القادم لمواشيك باستخدام سبعة منتجات غذائية 
غير تقليدية وهي: )١(‏ حبوب شوكولاتة ة٤‏ رس1 (۲) أصابع الزبدة. (۲) حليب» 
)٤(‏ أيس كريم فانيلياء )٥(‏ حبوب Cap'n Crunch‏ (1) الذرة الحلوة (لأن الذرة الحقيقية 
كلها ميتة)» (۷) شرائح البسكويت رهط۸. 


























e ;‏ : شوكولاتة 
شرائح | الذرة | وه | أيس كريم 8 na,‏ 

yهطA‏ | الحلوة | طعمصسإت | فانيليا | ^77 | Boy‏ 

Charms 

v | ero | ro | oyo € | wo‏ | 6 | .درطل 
y Poe‏ لا لا | نعم | نعم | نعم | شوكولاتة 
v $e Tog wg‏ | © | بم | م بروتين 
TDN we 1 1 1‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 




















التحليلات التوجيهية: التحسين والمحاكاة 





: 9 شوكولاتة 
شرائ الذرة Lol I| Capn‏ 
Cap 5 eu‏ أأيس كريم © | "T‏ 
Ahoy‏ | الحلوة | Crunch‏ | فانيليا ^" | $2531 
Charms‏ 
Y t £o w | Y Y o‏ كالسيوم 























وتظهر تكلفة الرطل بالدولارء وكذلك وحدات البروتين لكل رطل تساهم بهء ومجموع العناصر 
الغذائية ا منهضمة (11(2) التي يساهمون بها لكل رطلء ووحدات الكالسيوم لكل رطل. 
أنت تقدر أن الكمية الإجمالية من منتجات التغذية غير التقليدية تساهم بالمقادير التالية 
من العناصر الغذائية: ٠٠٠٠١‏ وحدة بروتين على dle TDN baag E YOg JÙ‏ الأقل» ومن 
٠‏ على الأقل إلى 1٠٠١‏ على الأكثر وحدة كالسيوم. 
ويوجد أيضًا بعض المتطلبات المتنوعة الأخرى: 
- لا يمكن أن تتجاوز الشوكولاتة في خطة التغذية الشاملة (بالرطل) مقدار العناصر الأخرى 
غير الشوكولاتة. ويعرض الجدول السابق ما إذا كان المنتج يعتبر شوكولاتة أم لا (نعم - 
شوكولاتة. لا = لیس شوكولاتة). 
- لا يمكن أن يشكل أي منتج تغذية واحدًا أكثر من ٠١‏ من الوزن الإجمالي (بالرطل) اللازم 
لإنشاء مزيج تغذية مقبول. 
- هناك نوعان من الحبوب (شوكولاتة (Cap Crunchو Lucky Charms‏ لا مكنهما 
مجتمعَين أن يكونا أكثر من ٤١‏ (بالرطل) من المزيج الإجمالي لتلبية متطلبات المزيج. 
حدد المستويات المثلى للمنتجات السبعة لوضع خطة تغذية أسبوعية خاصة بك بحيث تتدنٌّ التكلفة. 
لاحظ أن كل مقادير ا منتجات يجب ألا تحتوي على قيم كسرية (عدد الرطل أرقام صحيحة فقط). 
1- هذا التمرين مساهمة من د. 18711505 1161 من جامعة أوكلاهوما الحكومية لتوضيح قدرات 
النمذجة لبرنامج -Excel Solver‏ 
Cal‏ تعمل مع مجموعة كبيرة من العمال ال مؤقتين (مجموعة من اممتدربين وا متقاعدين» إلخ) 
لوضع مسودة خطة لفريق عمل مركز اتصال ليلي (للمستقبل القريب). لديك أيضًا مجموعة 
صغيرة من العمال ال متفرغين الذين هم ”ثوابتك“ - ولكنك وضعتهم بالفعل في الجدولء وقد أدى 
ذلك إلى متطلبات لتشغيل عمالة لديك. وأنت لا تهتم في النموذج بالعمال المتفرغين. 
وتكون متطلبات تشغيل العمالة يومية وهي: ١9‏ ليوم الاثنينء ٠٠١‏ ليوم الثلاثاءء ٠١‏ ليوم 
الأربعاءء ۲۲ ليوم الخميس» ۷ ليوم الجمعة» ۲۲ ليوم السبت و0" ليوم الأحد. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري VY‏ 











الفصل السادس 


لديك من 8 إلى ٠١‏ منهم لا يستطيعون العمل في عطلة نهاية الأسبوع (السبت أو الأحد). 
بالنسبة لهؤلاء الناس ”في يوم واحد فقط من أيام الأسبوع“» هناك ثلاث ورديات ممكنة: 
فسيعملون ع أيام من إجمالي o‏ أيام عمل في الأسبوع» وتحصل إحدى الورديات على عطلة في 
يوم الثلاثاءء ووردية أخرى في يوم الأربعاء» ووردية ثالثة في يوم الخميس. 
وعليك أن تخصص ثمانية أشخاص على الأقل لهذه الورديات ”في يوم واحد فقط من أيام الأسبوع“. 
وبالنسبة لجميع الورديات الأخرى (ولا تتقيد بحجم العمالة المشغلة). يعمل الشخص ع 
أيام من إجمالي V‏ أيام كل أسبوع. وسوف يعمل العمال لمدة أسبوعين ويومّي عطلة نهاية 
الأسبوع (وردية ”7 / 7"). وتعتبر جميع التوليفات «ذات اليومين» اليومية الممكنة ورديات 
عمل مرتبطة ماعدا أي توليفات يحصل فيها العمال على عطلة ثلاثة أيام متتاليةء فتلك الأيام 
غير مسموح بها ولا يجب أن تكون قي النموذج. 
نحن نعمل بنموذج بسيط جدًا - وبدون تكاليف؛ إذ يكون الهدف من نموذجنا هو إيجاد 
أقل عدد من العمال الذي يلبي الحد الأدنى اليومي المطلوب لمركز الاتصال ولا يتم الاستعانة بأكثر 
من أربعة عمال إضافيين (فوق الحد الأدنى للمتطلبات) خلال أي يوم واحد. 
كذلكء لا يمكن لجميع الورديات (”يوم واحد فقط من أيام الأسبوع" أو ورديات ١‏ / 7) أن 
«يخصص» لها أكثر من ستة أشخاص. 
قم بإنشاء نموذج أساسي يقبل بهذه القيود ويعمل على تدنية العدد الإجمالي للأشخاص المطلوبين 
لتحقيق الحد الأدنى من المتطلبات. إذا كان هناك مشكلةء نعم» عدد الأشخاص عدد صحيح. 
-V‏ هذا التمرين أيّا مساهمة من د. ١0ء1¡ a Rick‏ جامعة أوكلاهوما الحكومية. يحاک السيناريو 
البسيط التالي "8001 ys 555JI c5! 5e Business Week 4JUis ($ $5551 "Black‏ من عصير 
البرتقال. http://www.businessweek.com/articles/2013 -01- 31 coke-engineers-its-)‏ 
xay g3s—4 cLL23b e—8 (orange-juice-with-an-algorithm, accessed February 2013‏ 
خطية (1۴) مناسب لهذا السيناريو. 
بالنسبة للفترة الإنتاجية التاليةء يوجد خمس دفعات مختلفة من عصير البرتقال الخام يمكن 
خلطها معًا -Orenthal James .GlowMorn .SunnyQ .JU3;Jl jag coles gua‏ 
في تكوين الخليط الأمثل من ال منتجات الثلاثة من الدفعات الخمس المختلفةء يجب أن يهدف 
نموذج البرمجة الخطية إلى تعظيم صافي سعر البيع لكل جالون من المنتجات وتخفيض التكلفة 
المقدرة لكل جالون من العصير الخام. 


vé‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


ويتم هنا وصف خمس دفعات خام من عصير البرتقال من حيث درجة الحلاوة (821) واللب 
(م1نا) والمخزون المتاح (جالون) والتكلفة (دولار / جالون)» وكلها ذاتية التفسير: 
- دفعة -١‏ أناناس برتقال ل 15 - ١,٠ cbrix‏ - ملنامء WY gll Yo-‏ دولار / جالون. 
- دفعة ۲- آناناس برتقال 8 ۱۷ = ×ناا ۰,۹ = مانام ۲۰۰ جالون» ۴۲۲ دولار / جالون. 
- دفعة ۳- متوسط الحلاوةء ۲۰ = «,A .brix‏ = ماسم ۱۷۵ جالون» ۱٤١۳‏ دولار / جالون. 
- دفعة -٤‏ فالنسیاء ۱۸ = ×ناطاء Y,‏ = ماسم ۳۰۰ جالون» ٤٤,۲‏ دولار / جالون. 
- دفعة 0- brix = \é dhas Jp‏ ۱,۹ = ماسم ۲٣۵‏ جالون» ٥٥,۲‏ دولار / جالون. 
لاحظ أنه للتأكد من أن العصير الخام لا يصبح ”قديًا“ جدًّا رور الوقت» فإن أحد متطلبات 
الإنتاج هو أنه يتم بالضرورة استخدام X0*‏ على الأقل من المخزون eL‏ من كل دفعة في خلط 
منتجات عصير البرتقال الثلاثة (وبالطبع لا يمكن استخدام أكثر من المتاح). 
من منظور المنتج؛ يجب أن يكون هناك ٠٠١‏ جالون على الأقل من Wos SunnyQ Jil‏ 
جالون على الأقل من كل من 101921/101512© و07621131791363. وبامثل» يشير الطلب المستقبلي 
المتوقع على المنتجات إلى أنه في هذه الفترةء يلزم وجود إنتاج تام مقدار ٠٠١‏ جالون على الأكثر من 
SunnyQ‏ وهلا جالونًا على الأكثر من 610171/01©. و١٠ ٠"‏ جالون على الأكثر من 5دمة[1طامع:0. 
لاحظ أيصًاء أنه عند خلط المنتجات من الدفعات الخمس.ء فإن الدفعة المنفردة لا يمكنها أن توفر 
أكثر من ٤١‏ من إجمالي كمية أي منتج تام» ويتم تطبيق ذلك على كل منتج على حدة. 
وتشمل سمات المنتجات الثلاثة ما يلي: 
- سعر البيع. 
- الحد الأقصى لمتوسط درجة حلاوة (ذة) المنتج المخلوط dl‏ 
- الحد الأدنى طمتوسط درجة حلاوة cell (brix)‏ المخلوط النهائي. 
- الحد الأقصى لمحتوى اللب. 
وتشير متطلبات ”المتوسط" الثلاثة إلى أن المتوسط المرجح لكل العصير المخلوط ببعضه لذلك 
يجب أن يحقق المنتج تلك المواصفات. 
jew :SunnyQ -‏ البيع - 91,8 $ / Max Brix = 1۹ «jJl‏ قبا = Max Pulp -V Min Brix‏ 
gl sa :GlowMorn -‏ 2 15,8 8 / جالونء ١١‏ - عترظ قالط ثلارة١- .Max Pulp = 1,A Min Brix‏ 
:OrenthalJames -‏ سعر البيع - ثرالا 9 / جالونء -Max Pulp - \,| «Min Brix = 1۷,00 Max Brix - Wo‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 10 


الفصل السادس 


المرا اجع: 

- Arsham, H. (2006a). Modeling and simulation resources. home.ubalt.edu/ntsbarsh/Business-stat/ 
RefSim.htm (accessed July 2016). 

- Arsham, H. (2006b). Decision science resources.home.ubalt.edu/ntsbarsh/Business-stat/Refop.htm 
(accessed July 2016). 

- Bailey, M. J., Snapp, J., Yetur, S., Stonebraker, J. S., Edwards, S. A., Davis, A., & Cox, R. (2011). Practice 
summaries: American Airlines uses should-cost modeling to assess the uncertainty of bids for its full- 
truckload shipment routes. Interfaces, 41 (2), 194-196. 

- Banks, J., & Gibson, R. R. (2009). Seven sins of simulation practice. INFORMS Analytics, 24-27. www.analytics- 
magazine. org/summer-2009/193-strategic-problems-modeling-the-market-space (accessed July 2016). 

- Neonatal physician scheduling at the University of Tennessee Medical Center. Interfaces, 46(2), 168-182. 

- Businessweek.com. Coke engineers its orange juice—With analgorithm. www.businessweek.com/ 
articles/2013-01-31/coke-engineers-its-orange-juice-with-an-algorithm (accessed July 2016). 

- Chongwatpol, J., & Sharda, R. (2013). RFID-enabled track and traceability in job-shop scheduling environment. 
European Journal of Operational Research, 227(3), 453-463, http://dx.doi.org/10.1016/j.ejor.2013.01.009. 

- Christiansen, M., Fagerholt, K., Hasle, G., Minsaas, A., & Nygreen, B. (2009, April). Maritime transport 
optimization: An ocean of opportunities. OR/MS Today, 36(2), 26-31. 

- Clemen, R. T., & Reilly, T. (2000). Making hard decisions with Decision Tools Suite. Belmont, MA: 
Duxbury Press. Farasyn, I., Perkoz, K., & Van de Velde, W. (2008, July/August). Spreadsheet models for 
inventory target setting at Procter & Gamble. Interfaces, 38(4), 241-250. 

- Furman, K. C., Song, J. H., Kocis, G. R., McDonald, M. K., & Warrick, P. H. (2011). Feedstock routing 
in the ExxonMobil downstream sector. Interfaces, 41(2), 149-163. 

- Goodwin, P., & Wright, G. (2000). Decision analysis for management judgment, 2nd ed. New York: Wiley. 

- Hurley, W. J., & Balez, M. (2008, July/August). A spreadsheet implementation of an ammunition 
requirements planning model for the Canadian Army. Interfaces, 38(4), 271-280. 

- Hutton, D. W., Brandeau, M. L., & So, S. K. (2011). Doing good with good OR: Supporting cost- 
effective Hepatitis B interventions. Interfaces, 41(3), 289-300. 

- Kearns, G. S. (2004, January-March). A multi-objective, multi-criteria approach for evaluating ٽاaوgلعkll تقنية‎ 
investments: Results from two case studies. Information Resources Management Journal, 17(1), 37-62. 

- Kelly, A. (2002). Decision making using game theory: An introduction for managers. Cambridge, UK: 
Cambridge University Press. 

- Knight, F. H. (1933). Risk, uncertainty and profit: with an additional introductory essay hither to 
unpublished. London school of economics and political science. 


- Koksalan, M., & Zionts, S. (Eds.). (2001). Multiple criteria decision making in the new millennium. Berlin: Springer-Verlag. 


w‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل السابع 
مفاهيم وأدوات البيانات الضخمة 


أهداف التعلم: 
- تعلّم ما هي البيانات الضخمة وكيف تجعل عاط التحليلات يتغير. 
- فهم الحافز لتحليلات البيانات الضخمة وقائدي العمل لها. 
- الدراية التامة بنطاق عريض من تمكين التقنيات لتحليلات البيانات الضخمة. 
- تعلّم s NoSQLs MapReduces Hadoop‏ حيث ارتباطها بتحليلات البيانات الضخمة. 
- مقارنة وتناقض الاستخدامات المكملة لمستودعات البيانات وتقنيات البيانات الضخمة. 
- الدراية باختيار منصات وخدمات البيانات الضخمة. 
- فهم الحاجة إلى تحليلات التيار (تدفق البيانات) وتقدير إمكانياتها. 
- تعلّم تطبيقات تحليلات التيار (تدفق البيانات). 

لا تعتبر البيانات الضخمة - والتي تعني أشياء كثيرة لكثير من الناس - تقليعة تقنية جديدة. 
فقد أصبحت من أولويات الأعمال التي من المحتمل أن تغير خريطة المنافسة بشكل عميق في 
الاقتصاد المتكامل على الصعيد العالمي في هذه الأيام: بالإضافة إلى توفير حلول ابتكارية لتحديات 
الأعمال الدائمة؛ إذ تسعى البيانات الضخمة والتحليلات لإيجاد طرق جديدة لتحويل عمليات 
ومنظمات وصناعات بأسْرها وحتى المجتمع بالكامل. غير أن التغطية الإعلامية الشاملة تجعل 
من الصعب التمييز بين الدعاية والواقع. ويهدف هذا الفصل إلى توفير تغطية شاملة للبيانات 
الضخمة وتقنياتها التمكينية ومفاهيم التحليلات المرتبطة بها؛ وذلك للمساعدة في فهم قدرات 
وقيود هذه التقنية حديثة الظهور. فيبدأ الفصل بتعريف البيانات الضخمة ومفاهيمها المرتبطة, 
ياي ذلك التفاصيل الفنية للتقنيات التمكينية» -NoSQLs MapReduces Hadoop lgzs (7Jl5‏ 
ونقدم أيصًا تحلي لا مقارنًا بين مستودعات البيانات وتحليلات البيانات الضخمة» في حين يتم 
تخصيص الجزء الأخير من الفصل لتحليلات التيارء والتي تعتبر إحدى أقيم المقترحات الواعدة 
لتحليلات البيانات الضخمة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1۷ 


الفصل السابع 


V-V‏ مقال افتتاحي: تحليل حركة العملاء في شركة اتصالات باستخدام طرق 
البيانات الضخمة: 


Aal 


أرادت شركة اتصالات (تسمی ۸٥٤٤5 ۲61۲۲0٥۳‏ إ4۲] لأسباب تتعلق بالخصوصية) الحد من تحول 
العملاء عن خدمات الاتصالات الخاصة بها. وبالرغم من أن انتقال العملاء بين الشركات في صناعة 
الاتصالات fal aso‏ شائعًاء إلا أن شركة 47 كانت تفقد عملاءها بمعدل مقلق. وهذه ظاهرةٌ لها عدة 
أسباب وأيضًا لها حلولٌ ممكنة. فقد علمت إدارة الشركة أن العديد من الإلغاءات كانت بسبب مكايمات 
بين العملاء وقسم خدمة العملاء. ولدراسة المشكلة بصورة أعمق» تم تشكيل لجنة تضم أعضاء من 
مكتب علاقات العملاء وقسم تقنية ا معلومات» وكانت مهمتهم هي النظر في كيفية تقليص مشكلة تحول 
العملاء e slo‏ تحليل أنماط اتصال العملاء (طةمتصددة Sharda‏ وطء7220 .Kalgotras‏ 2016(. 


عقبات البيانات الضخمة: 
عندما يواجه العملاء مشكلة في مسائل معينة مثل الفواتير الخاصة بهم والخطة وجودة 
d LUI‏ فإنهم يتواصلون مع الشركة بطرق متعددة: منها: مركز الاتصال (66816 6211)» وموقع 
الويب الخاص بالشركة (من خلال روابط اتصل بنا ”5نا 0212©1ع6*), ومركز خدمة الحضور الشخصي 
(walk-ins)‏ ويمكن للعملاء إلغاء أي حساب من خلال إحدى التفاعلات المذكورة. أرادت الشركة 
النظر فيما إذا كان تحليل تفاعلات العملاء هذه يمكن أن يُنتج أي أفكار حول أسئلة العملاء أو قناة 
(قنوات) الاتصال التي استخدموها قبل إلغاء حسابهم. وظهرت البيانات التي تم إنشاؤها بسبب 
هذه التفاعلات إما في صورة نصية أو صوتية. ولذا؛ سينبغي على شركة ۸۲ أن تقوم بتجميع 
كل البيانات في موقع واحد. فقامت الشركة بفحص استخدام المنصات التقليدية لإدارة «LUI‏ 
ولكنها اكتشفت سريكًا أنها غير كافية لمعالجة تحليل البيانات المتقدم في السيناريو الذي يحتوي 
على تنسيقات متعددة للبيانات من مصادر متعددة (11500ط1' ومهط5 وتإ«مطنصسف 2010). 
كان هناك تحديان رئيسان في تحليل هذه البيانات وهما: ال مصادر المتعددة للبيانات والتي 
تؤدي إلى مجموعة متنوعة من البيانات وكذلك الحجم الكبير للبيانات. 
-١‏ البيانات من مصادر متعددة: يستطيع العملاء التواصل مع الشركة عن طريق الوصول إلى 
حساباتهم على موقع الويب الخاص بالشركة. مما يسمح لشركة ۸۲ بإنشاء سجل معلومات 
على الويب حول نشاط العميل. وقد تمكّنت الشركة باستخدام مسار هذا السجل من تحديد 


A‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


ما إذا كان العميل قد قام عبر الإنترنت بمراجعة خطته الحالية أو استلامها أو تقديم شكوى 
بشأنها أو التحقق من الفاتورة وكذلك تحديد متى قام بذلك. وفي مركز خدمة العملاء» QS‏ 
للعملاء أيضًا تسجيل شكوى بشأن الخدمة أو تقديم طلب بتغيير الباقة أو إلغاء الخدمة. 
سُحِلَتْ هذه الأنشطة في نظام معاملات الشركة وبعد ذلك في مستودع بيانات المنشأة. dels‏ 
يمكن للعميل الاتصال بمركز خدمة العملاء هاتفيًا وإجراء معاملاته التجارية وكأنه موجود 
شخصيًا في مركز خدمة العملاء. وكانت سجلات المكالمات متاحة في نظام واحد مع سجل 
بالأسباب التي يتصل العميل من أجلها. ومن أجل إجراء تحليل له معنىء كان لا بد من 
تحويل مجموعات البيانات الفردية إلى تنسيقات مهيكلة متشابهة. 

۲- حجم البيانات: كان التحدي الثاني هو الكمية الهائلة من البيانات من المصادر الثلاثة التي 
استلزم الأمر استخراجها وتنظيفها وإعادة هيكلتها وتحليلها. وبالرغم من أن غالبية مشروعات 
تحليلات البيانات السابقة اعتمدت على مجموعة عينات صغيرة من البيانات. إلا أن شركة 
1 قررت الاستفادة من التنوع المتعدد ومصادر البيانات جنبًا إلى جنب مع الحجم الكبير 
للبيانات المسجلة لتوليد العديد من الأفكار كلما أمكن. 
إن النهج التحليلي الذي مكنه استخدام جميع قنوات ومصادر البيانات» رغم ضخامتهاء سيكون 

قادرًا على توليد أفكار غنية وعميقة من البيانات للمساعدة في تقليل الإلغاءات. 


الحل: 

تم الاعتماد على بنية موحدة للبيانات الضخمة من شركة ill‏ ڌر (Teradata Aster)‏ 
لإدارة وتحليل البيانات الضخمة ذات الهيكلة المتعددة. وسنعرض في القسم (1-۷) بشيء من 
التفصيل لشركة 85167 12520818. كما يعرض الشكل )١1-1(‏ رسمًا تخطيطيًا للبيانات التي تم 
تركيبها. وقد تم إنشاء ثلاثة جداول بناءَ على كل مصدر للبيانات. حيث يحتوي كل جدول على 
المتغيرات التالية: رقم العميلء وقناة الاتصالء وختم التاريخ / الوقت. والإجراء المتَخَذ. وقبل 
الإلغاء النهائي للخدمة» يمكن لمتغير الإجراء المتخذ أن يكون واحدًا أو أكثر من هذه الخيارات 
الإحدى عشرة (التي تم تبسيطها لهذه الحالة): تقديم الاعتراض على الفاتورة» أو طلب تحديث 
الباقة, أو طلب تخفيض الباقة: أو القيام بتحديث الملف الشخصيء أو عرض ملخص الحساب» 
أو الوصول إلى دعم العملاءء أو عرض الفاتورةء أو مراجعة العقد. أو الوصول إلى وظيفة تحديد 
موقع المتجر على الويبء أو الوصول إلى قسم الأسئلة المتكررة على الويب» أو استعراض الأجهزة. 
وقد ركز هدف التحليل على إيجاد المسار الأكثر شيوعًا المؤدي إلى إلغاء الخدمة نهائيًا. وقد تم 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1۹ 


الفصل السابع 


تقسيم البيانات إلى مجموعة سلسلة من الأحداث تشتمل على عميل معين في فترة زمنية محددة 
de ehi o)‏ جميع قنوات الاتصال) كجلسة واحدة. وأخيراء تم استخدام وظيفة 22265 لتسلسل 
الوقت الخاصة بشركة Aster‏ (والتي تم تفعيلها في إطار )SQ1-M2pR duce‏ لتحليل الاتجاهات 
الشائعة التي أدت إلى إلغاء الخدمة. 








Sources: Teradata Corp. 
"11202068 345] مصادر بيانات متعددة مدمجة في‎ :١- شكل‎ 


النتائج: 

أشارت النتائج الأولية إلى العديد من المسارات التي قد تؤدي إلى طلب إلغاء الخدمة: مما 
من الشركة من تحديد آلاف الطرق التي قد يلجأ إليها العميل لإلغاء الخدمة. وتم إجراء تحليل 
متابعة لتحديد أكثر الطرق تكرارًا لطلبات الإلغاء. وتم الاصطلاح على هذا الإجراء باسم المسار 
الذهبي ”29:5 هء6010“. وتم تحديد ٠١‏ مسارًا كانوا هم الأكثر تسببًا في الإلغاء في الأجل القصير 
أو الطويل. ويعرض الشكل )١-1(‏ عينة لذلك. 

وقد ساعد هذا التحليل الشركة على تحديد العميل قبل إلغاء الخدمة وتقديم حوافز له أو على 
الأقل تصعيد قرار المشكلة إلى مستوى لا يرتقي إلى إلغاء الخدمة من جانب العميل. 


Ie‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








مفاهيم وأدوات البيانات الضخمة 


مركز الإتصال؛إلغاء الدمة: :مركز الإتصال 
PEETS‏ 
متجر إلغاء الخدمة 
:مركز الإتصال 
شكاوى الخدمة 


متجر :مشاكل 
الفواتير 





nd 
L4 


Sources: Teradata Corp. 
2922 Uus شكل ۲-۷: التصوير البياني لأعلى عشرين‎ 
ماذا يمكننا أن نتعلم من هذه المقالة القصيرة:‎ 
لا تتطلب كل مشاكل الأعمال استخدام منصة تحليلات البيانات الضخمة» بالرغم من أنه‎ 
يُفضل استخدامها في هذا ا موقف. وكان التحدي الرئيسي يدور حول خصائص البيانات محل‎ 
البحث. وقد مثلت الأنواع الثلاثة المختلفة من مجموعات بيانات تفاعل العميل تحديًا في‎ 
التحليل. كانت تنسيقات وحقول البيانات المتولدة في كل من هذه الأنظمة ضخمة» وكذلك كان‎ 
حجم تلك البيانات كبيرَاه مما أدى إلى ضرورة استخدام منصة تستخدم تقنيات تسمح بتحليل‎ 
حجم هائل من البيانات التي تأت في تنسيقات متنوعة.‎ 
وما يسترعي الانتباه أيضًا هو قيام شركة 41 بتوفيق أسئلة البيانات المطروحة على إستراتيجية‎ 
أعمال المنظمة. وقد أخبرت الأسئلة أيضًا عن نوع التحليل الذي تم إجراؤه. ومن المهم تَمَهُم‎ 
أنه بالنسبة لأي تطبيق لبنية البيانات الضخمة: فإن إستراتيجية أعمال المنظمة وتوليد الأسئلة‎ 
المرتبطة هما مفاتيح تحديد نوع التحليل المراد إجراؤه.‎ 
أسئلة مراجعة على المقالة الافتتاحية:‎ 
ما هي المشكلة التي أحدثها إلغاء خدمة العملاء لاستمرار أعمال شركة '4:1؟‎ -١ 
AT iå اذكر مع الشرح العقبات الفنية التي تحدثها طبيعة وخصائص بيانات‎ -۲ 
ما هو تقسیم البیانات؟ وماذا تحتم على ۸1 القيام بتقسيم بياناتها؟‎ -٣ 
ع- قم بإعداد دراسات أخرى تم فيها استخدام نماذج تحول العميل. ما هي أنواع المتغيرات التي‎ 
تم استخدامها في تلك الدراسات؟ كيف تختلف هذه المقالة الافتتاحية؟‎ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري MW‏ 











الفصل السابع 


0- اذكر منصات أخرى شائعة غير اء B oil iaia OLLI Odo Teradata‏ 
التعامل مع التحليل الموضح في الحالة السابقة. 


۲-۷ تعريف البيانات الضخمة: 

يُشَكل استخدام البيانات لفهم الزبائن / العملاء وعمليات الأعمال بهدف الحفاظ على 
(وتعزيز) النمو والربحية تحديًا كبيرًا ويتزايد هذا التحدي بالنسبة لمؤسسات اليوم. وقد 
أصبحت معالجة البيانات بالوسائل التقليدية في حينها غير عمليةء وذلك بسبب توافر المزيد 
والمزيد من البيانات في مختلف الأشكال والأنماطء وتسمى هذه الظاهرة في وقتنا الراهن ب 
”البيانات الضخمة“ حيث تحظى بتغطية إعلامية كبيرة بالإضافة إلى استحواذها على اهتمام 
مستخدمي الأعمال ومتخصصي تقنية ال معلومات بشكل متزايد. ونتيجة لذلك؛ فقد أصبح هناك 
مبالغة وإفراط في استخدام عبارة البيانات الضخمة مما جعلها عبارة طنانة في التسويق. 

وبالنسبة لذوي الاهتمامات والخلفيات المختلفة فإن البيانات الضخمة تعني لهم أشياء مختلفة. 
وقد تم استخدام مصطلح البيانات الضخمة بشكل تقليدي لوصف الكميات الهائلة من البيانات 
التي تم تحليلها عن طريق منظمات ضخمة مثل جوجل أو مشاريع العلوم البحثية في ناسا. غير 
أن هذا المصطلح يُعد مصطاحًا نسبيًًا لمعظم الأعمال؛ فكلمة ”ضخمة“ تعتمد على حجم المنظمة. 
حيث تدور النقطة الأساسية حول إيجاد قيمة جديدة داخل وخارج مصادر البيانات التقليدية. 
وتكشف إزاحة حدود تحليلات البيانات عن إحصاءات وفرص جديدةء وتعتمد كلمة «ضخمة» 
على المكان الذي بدأت منه وكيف يسور تقدمك. وينبغي أن تضع في اعتبارك الوصف العام 
للبيانات الضخمة. فالبيانات الضخمة هي التي تتجاوز نطاق بيئات الأجهزة شائعة الاستخدام 
أو قدرات أدوات البرامج المستخدمة لجمعها وإدارتها ومعالجتها في خلال فترة زمنية مقبولة من 
قبَلِ المستخدمين. وقد أصبح مصطلح البيانات الضخمة مصطاحًا شائعًا لوصف النمو المتسارع» 
ومدى توفرء واستخدام المعلومات: سواء كان مهيكلًا أم لا. وقد كتب الكثيرون عن اتجاه البيانات 
الضخمة وكيف كن أن يكون بمثابة أساس للابتكارء والمفاضلة» والنمو. وبسبب التحديات 
التقنية في إدارة الحجم الكبير للبيانات الواردة من مصادر متعددة, وأحيانًا بسرعة كبيرة. فقد تم 
Sources: Asamoah, D., Sharda, R., Zadeh, A., & Kalgotra, P. (2016). Preparing a big Data analytics professional:‏ 
A pedagogic experience. In DSI 2016 Conference, Austin, TX. Thusoo, A., Shao, Z., & Anthony, S. (2010).‏ 


Data warehousing and analytics infrastructure at Facebook. In Proceedings of the 2010 ACM SIGMOD 
International Conference on Management of Data (p. 1013). doi: 10.1145/1807167. 1807278. 


wY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


تطوير تقنيات جديدة إضافية للتغلب على التحديات التقنية. وعادةً ما ترتبط عبارة البيانات 
الضخمة بهذه التقنيات. وفي بعض الأحيان يتم توسيع مصطلح «البيانات الضخمة» على أنه 
تحليلات البيانات الضخمة. وذلك بسبب أن الاستخدام الأساسي لتخزين مثل هذه البيانات يؤدي 
للحصول على إحصاءات من خلال التحليلات. غير أن هذا المصطلح يصبح ذا محتوى مرن؛ إذ قد 
يعني أشياء مختلفة لأشخاص مختلفين. وفي هذا الفصل سوف نقوم باستخدام المصطلح الأصلي» 
لأن هدفنا هو تعريفك بمجموعات البيانات الضخمة وقدراتها في توليد الأفكار. 

من أين تأق البيانات الضخمة؟ أبسط إجابة عن هذا السؤال هي أن البيانات الضخمة «في 
كل مكان». حيث يتم التعامل الآن مع المصادر التي تم تجاهلها بسبب القيود الفنية على أنها 
مناجم ذهب. وقد b‏ البيانات الضخمة من سجلات الويب» وتحديد الهوية للموجات اللاسلكية 
(RFID)‏ والأنظمة العالمية (GPS) glab La‏ وشبكات الاستشعارء والشبكات الاجتماعية: 
والوثائق النصية المعتمدة على الإنترنت» وفهارس البحث على الإنترنت» والسجلات التفصيلية 
للمكالمات: وعلم الفلك: وعلوم الغلاف الجويء وعلم الأحياء» وعلم الجينات» والفيزياء النووية. 
والتجارب البيوكيميائيةء والسجلات الطبية: والبحوث العلمية» وا مراقبة العسكريةء وأرشيف 
الصور الفوتوغرافيةء وأرشيف الفيديوء بالإضافة إلى ممارسات التجارة الإلكترونية على نطاق 
واسع. وليست البيانات الضخمة بالشيء الجديدء لكن الجديد هو التغير اللمستمر في تعريف 
وهيكل البيانات الضخمة. ومنذ ظهور مستودعات البيانات في أوائل التسعينيات فإن الشركات 
تقوم بتخزين وتحليل كميات ضخمة من البيانات. وعلى الرغم من أن ترابايتس “terabytes”‏ 
كان يُستخدم كمرادف لمستودعات البيانات الضخمة: إلا أن هذا المصطلح تم استبداله الآن 
بمصطلح إكسابايتس ”65]إ8<ء"*. ومازال معدل النمو في حجم البيانات مستمرًا في التصاعد 
مع سعي المنظمات إلى تخزين وتحليل مستويات أعلى من تفاصيل المعاملات» فضلًا عن بيانات 
الويب وام ميكنةء لاكتساب فهم أفضل لسلوك العملاء وسير الأعمال. 

ويعتقد الكثير من (الأكاديمميين ومحللي / قادة الصناعة على حد سواء) أن إطلاق عبارة 
«البيانات الضخمة» على البيانات ذات الحجم الهائل هي تسمية خاطئة. فما تقوله وما تعنيه 
ليس بالضبط نفس الشيء» بمعنى أن البيانات الضخمة ليست فقط «ضخمة». فحجم البيانات 
الهائل هو خاصية واحدة فقط من ضمن عدة خصائص والتي ترتبط في الغالب بالبيانات الضخمة 
وتتضمن هذه الخصائص كلا من التنوع» والسرعةء والصدق» والتقلب» واقتراح القيمة» وغيرها. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ww‏ 


الفصل السابع 


تعريف البيانات الضخمة من خلال مصطلحات ”۷“: 

تُعرّف البيانات الضخمة من خلال المصطلحات الثلاثة للاختصار ”57“ وهي: الحجم 01136 
«variety e s ls‏ والسرعة 7إأك7610. وبالإضافة إلى هذه الاختصارات الثلاثة V?‏ فإننا نرى 
بعض المقدمين الرواد لحلول البيانات الضخمة يضيفون عددًا من ”7“ الأخرى: مثل الصدق 
J! á8U2yb (SAS) variability Ulo (IBM) veracity‏ اقتراح القيمة „value proposition‏ 

الحجم: من الواضح أن السمة الأكثر شيوعًا للبيانات الضخمة هي الحجم. وقد ساهمت عدة 
عوامل في الزيادة الهائلة في حجم البيانات مثل البيانات القائمة على المعاملات والتي تم تخزينها على 
مر السنين» والبيانات النصية المتدفقة باستمرار من وسائل التواصل الاجتماعيء والكميات المتزايدة من 
بيانات الاستشعار التي يتم جمعهاء بالإضافة إلى بيانات 15:17 و625 التي يتم إنشاؤها تلقائيًاء وغيرها. 
وقد أدى حجم البيانات المفرط في الماضي إلى ظهور مشاكل في التخزين» سواء كانت هذه المشاكل فنية 
أو مالية. غير أنه حاليًا ومع استخدام التقنيات المتطورة والمقترنة بتناقص تكاليف التخزينء فإن هذه 
المشكلات لم تعد مهمة؛ وبدلًا من ذلك. فقد ظهرت مشكلات أخرىء ومنها كيفية تحديد الملاءمة فيما 
بين كميات كبيرة من البيانات وكيفية إنشاء قيمة من البيانات التي تعتبر ذات صلة. 

وكما ذكر من قبل فإن مصطلح ضخمة هو مصطلح نسبي. فهو يتغير بمرور الوقت كما تختلف 
النظرة إليه باختلاف المنظمات. ومع الزيادة المذهلة في حجم البيانات: فإن تسمية المستوى التالي 
من البيانات الضخمة أيضًا كانت تمثل تحديًا كبير. وقد استبدلت أعلى مجموعة من البيانات 
والتي كانت تسمى بيتابايتس 65]:(ط8]ءم (213) ليحل محلها زيتابايتس (28) والتي هي عبارة 
عن تريليون جيجابيت (68) أو مليار تيرابايت (18). وتقدم رؤية فنية (1-1) بلحة عامة عن 
حجم وتسمية وحدات مستودعات البيانات الضخمة. 

ومن منظور تاريخي قريب فإن العام كان ملك حوالي ۰.۸ 2 من البيانات في عام Yea‏ 
وبحلول عام ۲١٠١‏ تخطت هذه المجموعة حاجز ال ١‏ 28؛ s‏ نهاية عام 27١1١‏ كان العدد قد 
وصل إلى ١,8‏ 28. ومن المتوقع أن يصل العدد إلى ££ (Adshead, 2014) Y -Y- ele Jsloo ZB‏ 
ومع نمو أجهزة الاستشعار وشبكة الإنترنت للأشياء (107 - والتي سنقدمها في الفصل التالي)» فإن 
هذه التوقعات قد تكون خاطئة. وعلى الرغم من أن هذه الأرقام مذهلة من حيث الحجم؛ فإن 
التحديات والفرص التي تأ معها هي أيضًا كذلك. 

رؤية فنية :١-!‏ حجم البيانات يتضخم بشكل أكبر وأكبر 

إن قياس حجم البيانات يواجه صعوبة في مواكبة الأسماء الجديدة. فنحن جميعًا نعرف الكيلوبايت 

(168. وهو ١٠٠١‏ بايت)» والميجابايت (818. وهي مليون بايت)» والجيجابايت GB)‏ وهي مليار 


"e‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


بايت»» والتيرابايت (18, وهي تريليون بايت). وخلاف ذلكء فإن الأسماء المعطاة لأحجام البيانات 
جديدة نسبيًا بالنسبة لمعظمنا. ويوضح الجدول التالي ما يأ بعد التيرابايت وما بعده. 














الاسم الرمز القيمة 
كيلوبايت KB‏ ف 
ميجابايت ye MB‏ 
جيجابايت Mt GB‏ 
تيرابايت ye TB‏ 
بيتابايت yo PB‏ 
EB Coblas]‏ ا 
زيتابايت yan ZB‏ 
يوتابايت yes YB‏ 
برونتوبايت* i BB‏ 
جيجوبايت* qu GeB‏ 


* اسم / رمز لم يعتمد رسميًا حتى الآن من قبل 51 (النظام الدولي للوحدات). 


ضع في اعتبارك أنه يتم إنشاء إكسابايت من البيانات على الإنترنت كل يوم» والتي تعادل 
٠١‏ مليون قرص فيديو رقمي 0۷5s‏ من ال معلومات ذات القيمة. وعندما يتعلق الأمر بكمية 
ا معلومات التي تمتد عبر الويب كل عام» فإن فكرة وجود كميات أكبر من البيانات - وهي 
زيتابايت - ليست بعيدة جدًا. وف الحقيقةء فإن خبراء الصناعة يقدرون بالفعل أننا سنشاهد 
سنويًا عبر الإنترنت VY‏ زيتابايت من حركة مرور البيانات بحلول عام ۲١٠١‏ - ومن الممكن أن 
تقفز لتصل إلى ۲,۳ زیتابایت بحلول عام ۲۰۲۰. ومن المتوقع أن تصل زيارات الإنترنت إلى ٠٠٠١‏ 
جيجابايت لكل فرد سنويًا بحلول عام .۲٠۲٠١‏ وعند الإشارة إلى يوتابايت» فإنه غالبا ما يتساءل 
بعض علماء البيانات الضخمة عن مقدار البيانات التي لدى 254 أو 181 عن الناس إجمانًا. كما 
أن وضع الشروط الخاصة بآقراص الفيديو الرقمية DVDs‏ يوتابايت سوف يتطلب 70١‏ تريليون 
منهم. أما يوتابايت» والتي هي عبارة عن ١‏ متبوعًا ب ۲۷ صفرَاء فإنها إلى الآن لم يتم اعتمادها 
من 51 الرسمية غير أنه من الواضح أنها معترف بها من قبل بعض الناس في مجتمع القياس» حيث 
يمكن استخدام هذا الحجم من الضخامة لوصف مقدار بيانات الاستشعار التي سوف نحصل 
عليها من الإنترنت في العقد القادم إن لم يكن قبل ذلك. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Mo‏ 











القصل السابع 


أما بالنسبة ل جيجوبايت فهي تمثل ٠١‏ مرفوعة إلى الأس .٠١‏ وفيما يتعلق بالمصدر الذي تأتي 
منه البيانات الضخمة, فإنه يجب أخذ ما يلي في الاعتبار: 
- يقوم مصادم الهدرونات الكبير 08131 بتوليد ١‏ بيتابايت à‏ الثانية الواحدة. 
- تنتج أجهزة الاستشعار من محرك طائرة بوينغ ٠١‏ تيرابايت من البيانات كل ساعة. 
- يتم استيعاب ٠٠١‏ تيرابايت من البيانات الجديدة كل يوم في قواعد بيانات .Facebook‏ 
- يتم تنزيل ٠٠٠١‏ تسجيل من تسجيلات الفيديو في الدقيقة» مع ترجمة ١‏ تيرابايت كل دقيقة على اليوتيوب. 
- سوف يقوم التلسكوب المقترح لمقياس الكيلومتر المربع (وهو أكبر تلسكوب في العالم) بتوليد 

إكسابايت من البيانات يوميًا. 

التنوع: تتشكل البيانات في الوقت الحاضر بجميع أنواع التنسيقات - بدءًا من قواعد البيانات 
التقليدية إلى مخازن البيانات الهرمية والتي أنشكت من قبل المستخدمين النهائيين بالإضافة إلى أنظمة 
المعالجة التحليلية الفورية» والوثائق النصية؛ والبريد الإلكترونيء و۷1 والبيانات التي جُمِعَت بواسطة 
جهاز استشعار: وبيانات الاستشتعارء فضلا عن بيانات الفيديؤ: والضوت:» وبيانات das‏ مؤشرات 
الأسهم. وتشير بعض التقديرات إلى أن ۸٠‏ إلى ۸٥‏ من بيانات جميع المنظمات تأخذ أحد الأشكال 
التنظيمية المهيكلة أو شبه المهيكلة (وهو تنسيق غير مناسب بمخططات قواعد البيانات التقليدية)» غير 
أنه لا يمكن إنكار قيمته وبالتالي» فإنه ينبغي تضمينه في التحليلات من أجل دعم القرار. 

السرعة: وفقًا لما ذكره Gartner‏ فإن السرعة يُقصد بها كلّ من السرعة في إنتاج البيانات ومدى 
سرعة معالجة البيانات (بمعنى أن يتم التقاطها وتخزينها وتحليلها) من أجل تلبية الحاجة أو الطلب. 
وتقوم بطاقات التعريف اللاسلكية 11:1 وأجهزة الاستشعار الآلية بالإضافة إلى أجهزة 6755© 
والعدادات الذكية بالعمل على التوجه بالاحتياج المتزايد للتعامل مع سيول البيانات في الوقت المناسب 
تقريبًا. وربما تكون السرعة هي الخاصية الأكثر إغفالًا من خواص البيانات الضخمة؛ حيث إن إعطاء 
رة الل بتر عة كاف ao Jie deal] go alil d‏ باعظم المنظلا. وبالفسبةاللبيئات e$‏ 
الحساسية تجاه الوقتء فإن ساعة التكلفة البديلة للبيانات تبدأ بتحديد اللحظة التي يتم فيها إنشاء 
البيانات. ومع مرور الوقتء تتراجع القيمة المقترحة للبيانات إلى أن تصبح في نهاية المطاف عديمة 
القيمة. ويؤدي الوصول إلى البيانات والاستجابة للظروف بشكل أسرع دائما إلى نتائج أكثر فائدة, 
سواء أكان الموضوع يتعلق بصحة المريضء أو سلامة نظام ا مرورء أو صحة السندات الاستشمارية. 

وفي عاصفة البيانات الضخمة التي نشهدها حاليّاه فإن جميع الأشخاص تقريبًا يركزون على 
تحليلات حالة الراحة 165:إ[هصه 4-656: وذلك باستخدام أنظمة برامج وأجهزة مُحَسَّنة لتجميع 


515 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


كميات كبيرة من مصادر البيانات المختلفة. وعلى الرغم من أن هذا الأمر مهم للغاية فضلًا عن 
قيمته العالية» إلا أن هناك فئة أخرى من التحليلات» مدفوعة بسرعة البيانات الضخمة» وتسمى 
«تحليلات تدفق البيانات» أو «التحليلات في حالة الحركة» والتي تتطور بسرعة. فإذا تم القيام 
بتحليلات تدفق البيانات بشكل صحيح ففي هذه الحالة يمكنها أن تكون ذات قيمة كبيرة» بل إنها 
قد تكون ]38 قيمة في بعض بيئات العمل من تحليلات حالة الراحة 5عناتإلهصة 6و:-3. وسوف 
نتناول هذا الموضوع بشيء من التفصيل لاحقًا في هذا الفصل. 

الصدق: الصدق هو مصطلح تم صياغته بواسطة 182/1 والذي يُستخدم على V" JI cl‏ الرابعة 
لوصف البيانات الضخمة. ويشير هذا المصطلح إلى التطابق مع الحقائق: الدقة؛ أو الجودةء أو 
الصدقء أو الثقة في البيانات. وغالبًا ما يتم استخدام الأدوات والأساليب من أجل التعامل مع 
صحة البيانات الضخمة وذلك عن طريق تحويل إلى بيانات ذات جودة عالية وجديرة بالثقة. 

القابلية للتغيير: فضلًا عن تزايد السرعات والتنوع في البيانات» يمكن أن تكون تدفقات البيانات 
غير متسقة بدرجة كبيرة مع القمم الدورية. هل هناك شيء كبير يتجه نحو وسائل التواصل 
الاجتماعي؟ رها يكون هناك 1۲0 (طرح عام مبدي) رفيع المستوى يلوح في الأفق. وربما تصبح 
السباحة مع الخنازير في جزر البهاما فجأة نشاطًا واجب الأداء أثناء العطلة. كما يمكن أن تكون 
الأحمال القصوى للبيانات اليومية وا موسمية والناجمة عن الحدث متغيرة إلى حد كبير مما يُشّكل 
تحديًا للإدارة - خاصة مع وسائل التواصل الاجتماعي المعنية. 

عرض القيمة: تتمثل الإثارة حول البيانات الضخمة في عروض القيمة الخاصة بها. أما الفكرة 
ا مسبقة حول البيانات «الضخمة» فتتمثل في كونها تحتوي (أو لديها قدرة أكبر على احتواء) المزيد 
من الأنماط والأشكال المثيرة للاهتمام أكثر من البيانات «الصغيرة». وبالتالي» فإن المنظمات يمكنها 
أن تكتسب قيمة تجارية أكبر من خلال تحليل البيانات الضخمة والغنية با ميزات» والتي قد لا 
يمكنها أن تكتسبها بطريقة أخرى. وعلى الرغم من أن اللمستخدمين يمكنهم اكتشاف الأنماط في 
مجموعات البيانات الصغيرة من خلال استخدام أساليب إحصائية بسيطة وطرق تعلّم الآلة أو 
أدوات طلب البحث وإعداد التقارير المخصصة:. إلا أن البيانات الضخمة تعني تحليلات «ضخمة». 
وتعني التحليلات الضخمة رؤية أكبر وأشياء وقرارات أفضلء والتي تحتاج إليها كل منظمة. 

ومن المرجح أن تتم إضافة المزيد من الخصائص (ربما تكون المزيد من ”7") إلى تلك القائمة, 
وذلك نظرًا لكون التعريف الدقيق للبيانات الضخمة (أو بنودها اللاحقة) لازال مطروحًا للمناقشة 
المستمرة في الدوائر الأكاديمية والصناعية. وبغض النظر عما يحدث» فإن أهمية وعرض قيمة البيانات 
الضخمة وُحِدَت لتبقى. ويعرض الشكل )١-۷(‏ بنية مفاهيمية حيث يتم تحويل البيانات الضخمة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري aw‏ 


الفصل السابع 


(الموجودة في الجانب الأيسر من الشكل) إلى رؤية عملية من خلال استخدام مزيج من التحليلات 
المتقدمة وتقدهها لمجموعة متنوعة من المستخدمين / الأدوار المختلفة لاتخاذ قرارات أسرع / أفضل. 





SOURCE: ASTERDATA-A TERADATA COMPANY. 
شكل ۳-۷: بنية مفاهيمية عالية المستوى لحلول البيانات الضخمة‎ 
وهناك مصطلح آخر تتم إضافته إلى الكلمات الطنانة للبيانات الضخمة وهو مصطلح البيانا‎ 


ات 
.alternative data à ..JI‏ وتعرض الحالة العملية elo álzàl (V-V)‏ متعددة من البيانات في 
عدد من السيناريوهات ال مختلفة. 


حالة عملية ١-۷‏ 
بيانات بديلة لتحليلات أو توقعات السوق 

يُعد الحصول على توقعات جيدة وفهم الوضع بشكل جيد أمرّا ضروريًا لأي سيناريوه 

إلا أنه مهم بشكل خاص لمثلي صناعة الاستثمار. كما أن إمكانية حصول المستثمر على 

مؤشر مبكر لكيفية عمل مبيعات معينة لمتاجر التجزئة من ال ممكن أن تمنحه قائمة حول 

شراء أو بيع أسهم هذا البائع حتى قبل أن تصدر تقارير الأرباح. وتعد مشكلة التنبؤ 
Sources: Higginbotham, S. (2012). As data gets bigger, what comes after a yottabyte? gigaom.‏ 
com/2012/10/30/as-data-gets-bigger- what-comes-after-a-yottabyte (accessed August 2016). Cisco.‏ 


(2016). The zettabyte era: Trends and analysis. cisco.com/c/en/us/solutions/collateral/service-provider/ 


visualnetworking- index-vni/vni-hyperconnectivity-wp.pdf (accessed August 2016). 


"A‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








مفاهيم وأدوات البيانات الضخمة 


بالنشاط الاقتصادي أو المناخ المحلي الذي يعتمد على مجموعة متنوعة من البيانات بخلاف 
بيانات التجزئة المعتادة هي ظاهرة حديثة جدًا كما أنها أدت إلى ظهور عبارة أخرى طنانة 
وهي «البيانات البديلة». ويُعد المزيج الرئيس في هذه الفئة من البيانات البديلة هو صور 
الأقمار الصناعية, غير أنه يتضمن أيضًا بيانات أخرى مثل وسائل التواصل الاجتماعيء أو 
الإيداعات الحكومية: أو إعلانات الوظائف. أو أنماط حركة المرورء أو التغييرات في مواقف 
السيارات أو المساحات المفتوحة التي اكتُشفّت من خلال صور الأقمار الصناعية, بالإضافة 
إلى oL‏ استخدام الهاتف المحمول في أي موقع محدد خلال أي وقت محدد. وأماط 
البحث على محركات البحث» وغير ذلك. وقد قامت شركة فيسبوك وغيرها من الشركات 
بالاستثمار في الأقمار الصناعية محاولةً تصوير العام كله بشكل يومي بحيث تتمكن من 
تعقب التغييرات اليومية في أي مكان ومن ثم استخدام المعلومات من أجل التنبؤ. وقد 
ورد العديد من الأمثلة المثيرة للاهتمام لتنبؤات متقدمة وموثوقة بدرجة عالية. وفي 
الواقع» فإن هذا النشاط تقوده شركات ناشئة. وفيما يلي بعض الأمثلة: 

- استخدام ٥٥)‏ ا۴۵۲۲ محرك التعرف على الصور من أجل تحليل أكثر من ١6,1‏ مليار 
صورة بغرض تحليل كل ركن من أركان العام لتحديد المناطق ذات الاتصال المنخفض. 

- راقبت شركة 1161125 105 مواقف السيارات عبر الولايات المتحدة من خلال 
صناديق الاستثمار المختلفة. حيث توقعت شركة ء6۲ ۸8 تحقيق أرباح قوية في 
الربع الثاني من عام ۲١٠١‏ لصالح 26136 00[: وقد اعتمدت الشركة في توقعاتها على 
تحليل مواقف السيارات. وقد استفاد عملاؤها (في الغالب عملاء صناديق الاستثمار) من 
هذه الرؤية المتقدمة. وقد وردت قصة أخرى مشابهة ل Wal-Mart‏ والتي استخدمت 
أعداد السيارات الموجودة في مواقف السيارات الخاصة بها من أجل توقع المبيعات. 

- قيام شركة 1051805 0.181 بتوفير مؤشرات الاقتصاد الكلي لقطاعات الصناعة 
المختلفة من خلال استخدام بيانات صور الأقمار الصناعية. فعلى سبيل المثالء تَذّعِي 
الشركة أنها أنتجت تقديرات يومية أفضل مما هو متاح الآن من وكالة الطاقة الدولية 
(184) من أجل تخزين النفط في جميع أنحاء العالمء وقد استطاعت فعل ذلك من خلال 
تحليل صهاريج تخزين النفط حول العام. 

- تتبع شركة 5020612017 للتغيرات في محيط ال مصنع لأكثر من ٠٠٠١‏ موقع مصنع 
صيني. وقد تمكنت الشركة باستخدام هذه البيانات» من تقديم فكرة عن النشاط الاقتصادي 
الصناعي للصينء وقد كانت هذه الفكرة أفضل بكثير مما قدمته الحكومة الصينية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري w‏ 


الفصل السابع 


- استخدام معامل 4۴۲65ء0 لبيانات الأقمار الصناعية من أجل التنبؤ بحصاد الدّرة 
في الولايات المتحدة بدقة أكبر من وزارة الزراعة الأمريكية. فالتنبؤات الأفضل قد يكون 
لها آثار مالية ضخمة على تداول العقود الآجلة. ومن أقدم الأمثلة على ذلك مثال لإحدى 
الشركات تُسمى ]1.321905 والتي تنبأت أيضًا بتقديرات محاصيل الذرة. وقد قامت شركة 
Lanworth 25/5 «1: Thomson Reuters‏ ثم دمجتها في خدمة 81108 الخاصة بهم. 

- قدرة شركة DigitalGlobe‏ على تحليل حجم الغابة بمزيد من الدقة نظرًا لقدرة 
برنامجها على عد كل شجرة في الغابة» مما يؤدي إلى تقدير أكثر دقة نظرًا لأنه لا توجد 
حاجة لاستخدام عينة تمثيلية. 

- قيام شركة Kensho‏ بالاستفادة من تحليل البيانات من مصادر متعددة (ذُكرت 
سابقًا) من أجل بناء محرك تجاري» وذلك بدعم من شركة 5داعه5 مهدمل1ه6. 

وقد أعطت هذه الأمثلة مجرد عينة من الطرق التي يمكن بها جمع البيانات من أجل 
إنشاء أفكار جديدة. وبالطبع؛ فإنه في بعض الحالات يكون هناك بعض المخاوف التي 
تتعلق بالخصوصية. فعلى سبيل المثالء ذكرت صحيفة 55666 11/811 في عام 1/١10‏ قصة 
لشركة ١٠41ء‏ وهي شركة توفر أدوات التمويل الشخصي لعدد من البنوك الكبيرة ومن 
ثم فإن الشركة يمكنها الوصول إلى ملايين من معاملات بطاقات الائتمان الخاصة بالعملاء 
وتقوم ببيع هذه البيانات إلى شركات تحليلات أخرى والتي يمكنها استخدام هذه المعلومات 
من أجل تطوير تنبؤات مبكرة حول كيفية اتجاه المبيعات نحو بائع تجزئة معين. 

وهذه المعلومات مطلوبة بشكل كبير من قبل متعاملي سوق الأوراق المالية. وقد 
أدت هذه القصة إلى حدوث ضجة كبيرة بسبب استخدام المعلومات الخاصة بالعملاء 
بطرق غير مصرح بها. Jla ob LÉT‏ قلقًا في بعض الدوائر حول مشروعية وضع مثل 
هذه التنبؤات المتقدمة حول سلعة معينة أو شركة معينة. وعلى الرغم من أن جميع 
هذه المخاوف سيتم حلها في نهاية المطاف من قبل صانعي السياسات إلا أنه من الواضح 
أن الطرق الجديدة والمثيرة للاهتمام والتي تُستخدم للجمع بين بيانات الأقمار الصناعية 
والعديد من مصادر البيانات الأخرى ينتج عنها ظهور مجموعة جديدة من شركات 
التحليلات» حيث تعمل جميع هذه المنظمات مع البيانات التي تتوافق مع مواصفات 
الثلاث (975) وهي تنوع العناصر وحجمها وسرعاتها. وبالإضافة إلى ذلك فإن بعض 
هذه الشركات تعمل أيضًا مع فئة أخرى من البيانات وهي أجهزة الاستشعارء والتي 
سنقوم بمناقشتها في الفصل التالي عندما نستعرض الاتجاهات الناشئة في التحليلات. غير 
أن هذه الشركات تقع ضمن مجموعة من التطبيقات المبتكرة والناشئة. 


Wwe‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


أسئلة للمناقشة: 

-١‏ ما هو العامل المشترك في الأمثلة التي تناولناها بالمناقشة في هذه الحالة العملية؟ 

۲- هل هكنك التفكير في تدفقات البيانات الأخرى التي قد تساعد في إعطاء دلالة 
مبكرة للمبيعات في متاجر التجزئة؟ 

- هل يمكنك التفكير في تطبيقات أخرى تحاي الطرق التي تم عرضها في هذه الحالة العملية؟ 
Sources: Dillow, C. (2016). What happens when you combine artificial intelligence‏ 
and satellite imagery. fortune.com/201630/03//facebook-ai-satellite-imagery/‏ 
(accessed July 2016). Ekster, G. (2015). Driving investment performance with‏ 
alternative data. — integrity-research.com/wp-content/uploads/201511//Driving-‏ 
Investment-Performance-With-Alternative-Data.pdf (accessed July 2016). Hope, B.‏ 
Provider of personal finance tools tracks bank cards, sells data to investors.‏ .)2015( 
wsj.com/articles/providerof-personal-finance-tools-tracks-bank-cards-sells-data-to-‏ 
investors-1438914620 (accessed July 2016). Orbital Insight. World Oil Storage Index.‏ 
orbitalinsight.com/solutions/world-oil-storage-index/(accessed July 2016). Shaw,‏ 
C. (2016). Satellite companies moving markets. quandl.com/blog/alternative-data-‏ 
satellite-companies (accessed July 2016). Steiner, C. (2009). Sky high tips for crop‏ 
traders. — http://www.forbes.com/forbes/20090907//technology-software-satellites-‏ 
sky-high-tipsfor-crop-traders.html (accessed July 2016). Turner, M. (2015). This is‏ 
the future of investing, and you probably can't afford it. businessinsider.com/hedge-‏ 


funds-are-analysing-data-to-get-an-edge-20158- (accessed July 2016). 


أسئلة للمراجعة على القسم :Y-V‏ 

ISU -١‏ تعتبر البيانات الضخمة مهمة؟ وما الذي تغير ليتم وضعها في مركز عام التحليلات؟ 

۲- عرف البيانات الضخمة. وطاذا يصعب تعريفها؟ 

-Y‏ ما هو أصل ”75“ التي تُستخدم لتعريف البيانات الضخمة. وأي منها يعتبر الأكثر أهمية في 
رأيك؟ وماذا؟ 

ع- ما رأيك في مستقبل البيانات الضخمة؟ وهل من الممكن أن تترك شهرتها لشيء آخر؟ وإذا كان 
UIS pÙ‏ فماذا سيكون هذا الشيء؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ww‏ 


الفصل السابع 


۳-۷ أساسيات تحليلات البيانات الضخمة: 
لا قيمة للبيانات الضخمة بحد ذاتها - بغض النظر عن حجم هذه البيانات» أو نوعهاء أو 
سرعتها - مالم يقم مستخدمو الأعمال بعمل شيء ما يعطي قيمة لمنظماتهم. وهنا تظهر في الصورة 
التحليلات ”الضخمة“. وعلى الرغم من قيام المنظمات دائما بتشغيل التقارير ولوحات المعلومات 
ضد مستودعات البيانات» إلا أن معظمها لم يفتح هذه المستودعات لإجراء استكشاف متعمق 
حسب الطلبء وهذا يرجع بشكل جز إلى التعقيد الشديد لأدوات التحليل بالنسبة للمستخدم 
العاديء كما يرجع أيضًا إلى أن المستودعات في الغالب لا تحتوي على جميع البيانات اللازمة 
للمستخدم القوي» غير أن كل ذلك على وشك التغيير بطريقة مثيرة (وبالفعل تم تغيير البعض)» 
وذلك بفضل النموذج الجديد لتحليلات البيانات الضخمة. 
وعلى الرغم من عرض قيمة البيانات الضخمة: غير أنها تسببت أيضًا في تحديات كبيرة للمنظمات» 
حيث إن الوسائل التقليدية لالتقاط وتخزين وتحليل البيانات غير قادرة على التعامل بفاعلية 
وكفاءة مع البيانات الضخمة. ولذلك؛ فإن السلالات الجديدة للتقنيات ينبغي تطويرها (أو شراؤها 
/ استخدامها / الاستعانة بمصادر خارجية) من أجل مواجهة تحديات البيانات الضخمة. كما ينبغى 
على المنظمات قبل اتخاذ أي خطوات في هذا الاستثمار أن تبين أسباب استخدام مثل تلك الوسائل. 
وفيما ياي نذكر بعض الأمثلة التي قد تساعد في تسليط الضوء على هذه الحالة. واعلم أنك ستكون 
بحاجة للتفكير الجاد في الإبحار في رحلة البيانات الضخمة في حال تحقّق إحدى الحالات التالية: 
- إذا كنت لا تستطيع معالجة مقدار البيانات التي تريدها بسبب المحددات المفروضة من 
نظامك الحالي أو البيئة الحالية. 
- إذا كنت تريد تضمين مصادر بيانات جديدة / معاصرة (مثل: وسائل التواصل الاجتماعي» 
RFID‏ الحسيّة. الويبء 625 البيانات النصية) في منصة البيانات الخاصة بكء غير أنك لا 
تستطيع ذلك نظرًا لعدم توافقها مع الصفوف والأعمدة المحددة في مخطط مستودعات البيانات 
دون التضحية بثبات أو ثراء البيانات الجديدة. 
- أن تكون في حاجة إلى (أو ترغب في) دمج البيانات بأسرع ما يمكن لتتوافق مع تحليلاتك. 
- أن تكون لديك رغبة في العمل بمخطط حسب الطلب (بدلا من المخطط المحدد سلقًا والذي 
يُستخدم في أنظمة إدارة قواعد البيانات ذات الصلة [181082155]) لأن طبيعة البيانات الجديدة 
قد لا تكون معروفةء أو قد لا يكون هناك متسع من الوقت لتحديد ذلك وتطوير المخطط له. 
- وصول البيانات إلى منظمتك بصورة سريعة» بحيث لا تستطيع منصة التحليلات التقليدية التعامل معها. 


wy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


وكما هو الحال مع أي استثمار كبير في مجال تقنية المعلومات: فإن النجاح في تحليلات البيانات 
الضخمة يعتمد على عدد كبير من العوامل. ويعرض الشكل Dga (E-V)‏ بيانيًا لأكثر عوامل 
النجاح أهمية )2012 (Watson,‏ 








w 
5m * 
e». 


+ 9 


شكل /!-6: عوامل النجاح لتحليلات البيانات الضخمة 
وفيما ياي أهم عوامل نجاح تحليلات البيانات الضخمة )& Watson, Sharda,‏ 

:(Schrader, 2012 

-١‏ وضوح احتياجات الأعمال (بحيث تتوافق مع الرؤية والإستراتيجية): فالاستثمارات في الأعمال 
ينبغي أن تتم لصالح العملء وليس ممجرد التقدم مجال التقنية. ولذلك؛ فإنه ينبغي أن 
تكون احتياجات الأعمال هى ال محرك الرئيس لتحليلات البيانات الضخمة على كل المستويات: 
الإستراتيجيء والتكتيي. بالإضافة إلى التشغيلي. 

-Y‏ رعاية قوية» ملتزمة (بطل تنفيذي): فمن المعروف جيدًا أنه من الصعب (إن لم يكن مستحيلًا) 
تحقيق النجاح» إذا م يكن لديك رعاية ودعم تنفيذي قوي وملتزم. هذه الرعاية يمكن أن 
تكون على مستوى الإدارات» وذلك في حالة إذا كان المدى عبارة عن تطبيق تحليلي فردي أو 
عدد قليل من التطبيقات التحليلية. ومع ذلك فإنه في حالة ما إذا كان الهدف هو التحول 
التنظيمي على نطاق المؤسسة» وهو ما يحدث في كثير من الأحيان لمبادرات البيانات الضخمة 
فينبغي أن تكون الرعاية على أعلى المستويات كما ينبغي أن يكون التنظيم واسع النطاق. 

ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wr‏ 








القصل السابع 


-Y‏ التوافق بين الأعمال وإستراتيجية تقنية المعلومات: فمن الضروري التأكد من أن العمل 
التحليلي يدعم داتمًا إستراتيجية العمل وليس العكس. وينبغي أن تلعب التحليلات الدور 
التمكيني في تنفيذ إستراتيجية الأعمال بنجاح. 

-٤‏ ثقافة صنع القرار ا مبني على الحقيقة: في ثقافة صنع القرار المبني على الحقيقةء يكون الاعتماد 
على الأرقام بدلا من الحدسء أو الشعور الغريزي» أو افتراض عملية صنع القرار. وهناك أيضًا 
ثقافة التجريب لمعرفة ما يصلح ومالا يصلح. ولإنشاء هذه الثقافة تحتاج الإدارة العليا إلى: 
- إدارك أن بعض الأشخاص لا يمكنهم أو لن يقوموا بضبط ذلك. 
- أن تكون so els‏ 

- التأكيد على ضرورة وقف الأساليب القديمة. 
- أن تطلب معرفة أي التحليلات دخلت في القرار. 
- أن تربط الحوافز والمكافأت بالسلوكيات المرغوبة. 

0- بنية تحتية قوية للبيانات: قدمت مستودعات البيانات البنية الأساسية للبيانات من أجل 
التحليلات. وفي عصر البيانات الضخمة فإن هذه البنية الأساسية يتم تغييرها وتعزيزها 
باستخدام تقنيات جديدة» حيث يتطلب النجاح أن يتم الجمع بين القديم والجديد من أجل 
بنية أساسية شاملة تعمل بصورة تآزرية. 

وتزداد الحاجة إلى أنظمة تحليلية أكثر كفاءة. كلما ازداد الحجم والتعقيد. وقد تم تطوير 
عدد من التقنيات الحسابية والمنصات المبتكرة والجديدة. من أجل مواكبة الاحتياجات الحسابية 

للبيانات الضخمة. وهذه التقنيات مجتمعةً تسمى الحوسبة عالية الأداءء والتي تتضمن ما ياي: 

- تحليلات داخل الذاكرة: وهي تقوم بحل المشاكل المُعقدة فور حدوثها تقريبًا بأفكار عالية 

الدقة من خلال السماح معالجة:وتوزيع الحساات التخليلية والبيانات :الضخمة في الذاكرة عبر 

مجموعة مخصصة من العقد. 

- تحليلات داخل قاعدة البيانات: وتعمل على توفير الوقت للأفكار وتمكين إدارة البيانات بشكل 

أفضل من خلال إجراء تكامل للبيانات والوظائف التحليلية داخل قاعدة البيانات بحيث لا 

تضطر إلى نقل البيانات أو تحويلها بشكل متكرر. 

- الحوسبة الشبكية: وتعمل على رفع الكفاءة. وخفض التكلفةء وتحسين الأداء عن طريق معالجة 

الوظائف بشكل مشترك تتم إدارته مركزيًا من قبل موارد تقنية المعلومات. 

- الوسائل: يتم الجمع بين الأجهزة والبرامج في وحدة مادية لا تتسم بالسرعة فقطه بل هي أيضًا 

قابلة للتطوير على حسب الحاجة. 


we‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


وتمثل المتطلبات الحاسوبية مجرد جزء صغير من قائمة التحديات التي تفرضها البيانات 

الضخمة على مشروعات اليوم. وقد عثر مديرو الأعمال التنفيذيون على تحديات ذات تأثير كبير 

على التنفيذ الناجح لتحليلات البيانات الضخمة. وعند النظر في مشاريع وأساليب بناء البيانات 

الضخمة» فإن التنبه لهذه التحديات سوف يجعل رحلة تحليلات الكفاءة أقل إرهافًا. وفيما يلي 

قائمة بهذه التحديات: 

- حجم البيانات: القدرة على جمع: وتخزينء ومعالجة حجم ضخم من البيانات بسرعة ملائمة 
حيث تكون أحدث المعلومات متاحة لصانعي القرار في حالة حاجتهم إليها. 

- تكامل البيانات: القدرة على الجمع بين البيانات غير متشابهة الهيكل أو المصدر مع مراعاة أن 
يتم عمل ذلك بسرعة وبتكلفة معتدلة. 

- إمكانات المعالجة: القدرة على معالجة البيانات بسرعة؛ بمجرد وجودهاء حيث إن الطريقة 
التقليدية لجمع ومعالجة البيانات ربما لا تؤدي العمل المطلوب. ولذلك؛ فإنه في العديد من 
الحالات» ينبغى تحليل البيانات بمجرد الحصول عليها للاستفادة من أكبر قدر ممكن من قيمتها 
(وهذا ما يسمى بتحليلات التيارء والتي سوف نتناولها لاحقًا في هذا الفصل). 

- التحكم ف البيانات: القدرة على حفظ الأمنء» والسريةء وحقوق الملكيةء وجودة البيانات 
الضخمة. وينبغي أن تتناسب قدرات ممارسة التحكم مع حجم تغيير البيانات» وتنوعها (في 
التنسيق وا مصدر)ء وسرعتها. 

- توافر المهارات: يتم استغلال البيانات الضخمة من خلال استخدام أدوات جديدة كما يتم البحث 
عنها بطرق مختلفة. وهناك نقص في الأشخاص (الذين يطلق عليهم غالبًا علماء البيانات) ذوي 
المهارات اللازمة للقيام بهذه المهمة. 

- تكلفة الحل: هناك قدرٌ كبيرٌ من التجارب والاكتشافات التي تجري لتحديد أنماط هذه المسألة 
والأفكار التي تتحول إلى قيمة» وذلك بسبب ما قدمته البيانات الضخمة من تحسينات الأعمال 
الممكنة. ولضمان تحقيق عائد إيجابي على الاستثمار في مشروع البيانات الضخمة: فإنه من 
الضروري تقليل تكلفة الحلول المستخدمة لإيجاد تلك القيمة. 

وكما أن التحديات حقيقية» فإن عرض قيمة تحليل البيانات الضخمة يكون أيصًا كذلك. وأي شيء 

يمكنك القيام به باعتبارك قائد لتحليل الأعمال من أجل المساعدة في إثبات قيمة مصادر البيانات 

الجديدة بالنسبة إلى الأعمال. سوف ينقل مؤسستك إلى ما هو أكثر من مجرد تجريب واستكشاف 

البيانات الضخمة في تكييفها وتبئيها باعتبارها شيئًا مختلفًا. ولا يوجد شيء خاطئ مع الاستكشافه غير 

أن القيمة تأ في نهاية المطاف من وضع تلك الأفكار موضع التنفيذ. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wo‏ 


القصل السابع 


مشاكل الأعمال التي تم علاجها من خلال تحليلات البيانات الضخمة: 
تتمثل أهم مشالل الأعمال التي تتم معالجتها عن طريق البيانات الضخمة بوجه عام في 
كفاءة العمليات وتخفيض التكاليفء بالإضافة إلى تعزيز تجربة العملاء غير أنه عندما يتم النظر 
إليها من منظور قطاع الصناعة فإن هناك أولويات مختلفة تظهر. وربما تكون كفاءة العمليات 
وتخفيض التكلفة مصنفة من ضمن المشكلات ذات المستوى الأعلى والتي هكن معالجتها باستخدام 
تحليلات البيانات الضخمة لقطاعات التصنيع» والحكومة» والطاقة واممرافق» والاتصالات والإعلا 
والنقل والرعاية الصحية. كما أن تعزيز تجربة العملاء قد تكون على رأس قائمة المشكلات التي 
تعالجها شركات التأمين. وبالنسبة للشركات في القطاع المصرفي والتعليم فإنه عادةً ما تكون 
إدارة المخاطر على رأس القائمة. وفيما يلي قائمة جزئية بالمشاكل التي يمكن معالجتها باستخدام 
تحليلات البيانات الضخمة: 
- كفاءة العملية وخفض التكلفة. 
- إدارة العلامة التجارية. 
- تعظيم العائد والبيع المتقاطعء والبيع من خلال وسطاء. 
- تجربة العملاء ا محسنة. 
- تحديد هوية تحول العملاءء» والمحافظة على العملاء. 
- خدمة العملاء المحسنة. 
- تحديد المنتجات الجديدة وفرص السوق. 
- إدارة المخاطر. 
- الامتثال للوائح التنظيمية. 
- إمكانات الأمان ا محسنة. 
وتضرب الحالة العملية liaa ia (V-V)‏ للصناعة المصرفية. حيث يتم تكامل المصادر المختلفة 
للبيانات مع البنية الأساسية للبيانات الضخمة من أجل التوصل إلى مصدر واحد للحقيقة. 
حالة عملية ۲-۷ 
بنك توب فايف إنفستمنت dl dco! (S À»» (Top Five Investment)‏ 32-22 
واحد للحقيقة 
يعتبر فريق مشتقات البنك الذي يحظى بالاحترام الفائق مسؤولًا عن أكثر من ثلث 
إجمالي تجارة المشتقات في العالم. كما أن ممارسة هذا الفريق للمشتقات لها بصمة 


wa‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


عاممية في مقابل الفرّق التي تدعم الائتمان» ومعدلات الفائدة. ومشتقات الأسهم في كل 
منطقة من مناطق العام. وقد حصل البنك على العديد من الجوائز في مجال الصناعة 
ello‏ بها لابتكارات منتجاتها. 

التحدي: 

وقد أدركت إدارة البنك بتعرضها للمشتقات المهمة. أهمية وجود رؤية عاللمية 
في الوقت المناسب لمواقعها. وقد تألف النظاه الحاليء والذي يستند على قاعدة 
بيانات علائقية» من العديد من المنشآت حول العالم. وبسبب التوسعات التدريجية 
من أجل استيعاب تزايد أنواع حجم البيانات» فإن النظام القديم لم يكن سريعًا بما 
يكفي ليلبي احتياجات ومتطلبات العمل المتزايدة. حيث م يتمكن هذا النظام من 
تقديم تنبيهات في الوقت المناسب لإدارة السوق واممناصب الائتمانية ا مناظرة ف الإطار 
الزمني المرغوب فيه. 

الحل: 

قام البنك ببناء متجر للمشتقات التجارية بناءً على Jol 3554) MarkLogic‏ 
تحليلات بيانات ضخمة). لتحل محل التقنيات الحالية. وقد تمكن البنك من معرفة 
وضعه في السوق ووضعه الائتماني في الوقت المناسبء وذلك من خلال استبدال خوادم 
معالجة الدفعات المختلفة العشرين بمخزن تجاري واحد جاهز للتشغيلء مما وفر 
القدرة على التصرف بسرعة للحد من المخاطر. وقد سمحت دقة واكتمال البيانات 
للبنك وجهاز التنظيم الخاص به» بالاعتماد بشكل واثق على المقاييس ونتائج اختبار 
الضغط التي يقدمها. 

وقد اشتملت عملية الاختيار على ترقية كل من تقنية 01816 وتقنية 50856 
الحاليتينء بالإضافة إلى الوفاء بجميع المتطلبات التنظيمية الجديدة والذي يُعد عاملًا 
رئيسًا في اتخاذ القرار فقد كان البنك يتطلع إلى زيادة استثماراته إلى أقصى حد. وقد كان 
الخيار واضحًا بعد التحقيق الدقيق الذي أجراه البنك. فلم يتمكن أي من الخوادم من 
تلبية كلا الحاجتين فضلًا عن توفير أداء أفضلء وقابلية التوسع» وتطوير أسرع للمتطلبات 
المستقبلية والتنفيذية. وتكلفة إجمالية أقل لحقوق الملكية. سوى häò MarkLogic‏ 
والذي استطاع أن يفي بكل ذلك. ويوضح الشكل (-0) التحويل من الأنظمة المُجزأة 
القدهة إلى النظام الموحد الجديد. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wv‏ 


الفصل السابع 








كان من الصعب تحديد العرض المالي فى 
العديد من الأنظمة 
(نسخ منفصلة لمخزن تجارة المشتقات) 
pedi d i‏ من الممكن تحليل جميع العقود فى 
RN —‏ —1—1—1— قاعدة بيانات منفردة (يقوم خادم 
SED SSSss- S‏ 
بإزالة الحاجة إلى 20 نسخة من قاعدة البيانات). 


Sources: MarkLogic. 


شكل :0-١'‏ الانتقال من عدة أنظمة قدهة إلى نظام جديد موحد 


النتائج: 

MarkLogic Je jUzVI a5‏ نظرًا U‏ يوفره من تحديث لجزء من الثانيةء بالإضافة 
إلى أوقات الاستجابة للتحليل اللازمة لإدارة سجل تجارة المشتقات بشكل فعال والذي 
يمثل ما يقرب من ثلث السوق العلميء في حين أن النظم الحالية لن تقدم ذلك. والآن 
يتم تجميع البيانات التجارية بدقة من خلال ملف مشتقات البنك بالكامل» مما يسمح 
لأصحاب المصلحة بإدارة المخاطر معرقفة ملف ال مخاطر الحقيقي للمؤسسة» لإجراء 
التحليلات التنبؤية باستخدام بيانات دقيقة» ولاعتماد نظرة تطلعية. ولا يقتصر الأمر 
على توفير مئات آلاف الدولارات من تكاليف التقنية كل عام» بل إن البنك لا يحتاج إلى 
إضافة موارد للوفاء بالمطالب المتزايدة للهيئات التنظيمية من أجل مزيد من الشفافية 
وتكرار اختبار الضغط. وفيما ياي أهم العناصر: 

- تعمل ميزة التنبيه على إبقاء المستخدمين على دراية فورية بتغييرات السوق 
والتغييرات الائتمانية لنظرائهم حتى يتمكنوا من اتخاذ الإجراءات المناسبة. 

- يتم تخزين المشتقات وتداولها في odha Ys ga MarkLogic elbs‏ أي توقف 
للصيانةء مما يعطيه ميزة تنافسية كبيرة. 

- يمكن إجراء تغييرات معقدة خلال ساعات في حين أن الخوادم الأخرى تستغرق 
أيامًا وأسابيع بل وقد تصل إلى أشهر. 


WA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








مفاهيم وأدوات البيانات الضخمة 


(JI Sybases Oracle Jlauzal ssl -‏ خفض تكاليف العمليات بشكل كبير حيث أنه 
يوفر: نظام واحد مقابل ٠٠١‏ نظامّاء ومسؤول قاعدة بيانات واحد بدلا من ٠١‏ بالإضافة 
إلى انخفاض تكاليف كل عملية تداول. 

الخطوات التالية: 

أدى النجاح في تنفيذ النظام الجديد وأدائه إلى فحص البنك لمناطق أخرى حيث 
يمكنه أن يستخلص قيمة أكبر من بياناته الضخمة المُهيكلة أو غير المهيكلة و / أو 
المتسلسلة. وهناك تطبيقان قيد ال مناقشة النشطة. حيث ترى أعمال أبحاث الأسهم 
الخاصة بهم فرصة لزيادة الإيرادات بشكل كبير من خلال نظام أساسي يوفر الأبحاث في 
الوقت المناسب. كما يوفر إعادة التهيئة. فضلًا عن المحتوى. كما يرى البنك أيضًا قوة 
مركزية بيانات العملاء في تحسين الإعداد. وزيادة فرص البيع المتقاطع: ودعم اعرف 
متطلبات عميلك. 

أسئلة للمناقشة: 

-١‏ كيف يكن الاستفادة من البيانات الضخمة في البنوك التجارية على نطاق واسع؟ 

-١‏ كيف ساعدت البنية الأماسية ل عذع218511.0 في تسهيل الاستفادة من البيانات الضخمة؟ 

۳- ما هي التحديات» والحل المقترح» والنتائج التي تم التوصل إليها؟ 

investment bank achieves single 0 Top .(Y*YY) .Sources: MarkLogic 
derivativestrading--O-source of truth. marklogic.com/resources/top 


(Y *MY1 bank-achieves-single-source-of-truth (accessed July 
V-V أسئلة للمراجعة على القسم‎ 
ما هي تحليلات البيانات الضخمة؟ وكيف تختلف عن التحليلات المنتظمة؟‎ -١ 
ما هي عوامل النجاح ذات الأولوية لتحليلات البيانات الضخمة؟‎ -۲ 
ما هي التحديات الكبيرة التي ينبغي مراعاتها عند اعتماد تنفيذ تحليلات البيانات الضخمة؟‎ -" 
ما هي مشاكل العمل الشائعة التي تم علاجها بواسطة تحليلات البيانات الضخمة؟‎ -€ 


٤-۷‏ تقنيات البيانات الضخمة: 


هناك عدد من التقنيات لمعالجة البيانات الضخمة: غير أن معظمها لها بعض الخصائص المشتركة 
)2012 تزلاء>1). وهذا يعني أنهم يستفيدون من الأجهزة السلعية لتمكين أساليب التدريج والتعامل 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Wa‏ 


الفصل السابع 


المتوازي؛ واستخدام قدرات مستودعات البيانات غير الارتباطية بمعالجة البيانات غير المهيكلة وشبه 
المهيكلة؛ وتطبيق تقنية متقدمة للتحليلات والتصوير البصري للبيانات الضخمة من أجل نقل الأفكار إلى 
المستخدمين النهائيين. وتتمثل تقنيات البيانات الضخمة الثلاثة البارزة في ع6012خ1م8/12, 3«Hadoops‏ 
1 والتي يُعتقد أنها على الأغلب سوف تحول تحليلات الأعمال وأسواق إدارة البيانات. 


:MapReduce 


das Syb gs Lais Golul MapReduce as?‏ والذي يقوم بتوزيع معالجة ملفات البيانات 

الضخمة متعددة الهيكلة عبر مجموعة كبيرة من الآلات. ويتم تحقيق الأداء العالي عن طريق تقسيم 

المعالجة إلى وحدات صغيرة من العمل التي يمكن تشغيلها بالتوازي عبر المئات: بل قد تكون عبر الآلافه 
من العقد في مجموعة الآلات تلك. وفيما ياي اقتباس الوثيقة المهمة المتعلقة ب ءducءMpR:‏ 

MapReduce o‏ هو نموذج برمجة وتنفيذ متراإبط معالجة وتوليد مجموعات 
البيانات الضخمة. حيث تتم موازنة البرامج المكتوبة على هذا النمط الوظيفي تلقائيًا 
وتنفيذها على مجموعة كبيرة من آلات المادة. الجدير بالذكر أن استخدام مثل هذه 
الأنظمة المتوازية والموزعة يسمح للمبرمجين الذين ليس لديهم أي خبرة بالاستفادة 
بسهولة من موارد نظام التوزيع الكبير. )2004 (Dean & Ghemawat,‏ 

وتتمثل النقطة الأساسية التي ينبغي ملاحظتها من هذا الاقتباس في as} MapReduce oj‏ 
نموذج برمجة» وليس لغة برمجة» وهذا يعني أنه مصمم ليتم استخدامه من قبل المبرمجين» وليس 
مستخدمي الأعمال. ولوصف كيفية عمل Ja—»b MapReduce‏ طريقة. سنقوم بضرب „Js‏ 
انظر عداد المربعات الملونة 5ناو0010605 في الشكل (1-1). 


zxus $22 332 

















4. ee "7^ 
>< ل‎ O k++ oo e: 
xA 9 Le -P 
69 له عد‎ ><: m x - 
x*oeA IHE HH EJEJ A 
cte _ ل لل 1 فا‎ Xx xxx 
Ao~ AAA 
9A >> I 

دالة التقليل دالة الخريطة بیانات خام 


Mapreduce &JasJ Lo شكل 1-۷: تصوير‎ 


we‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 














مفاهيم وأدوات البيانات الضخمة 


لاحظني هذا الشكل أن المدخلات إلى عملية ©1601:2م113 هى عبارة عن مجموعة من 
المربعات الملونة. والهدف هو حساب عدد مربعات كل لون. وفي هذا المثال ges ossa‏ 
مسؤولًا عن ترميز الخريطة والتقليص من البرامج؛ وما يتبقى من ال معالجة يتم التعامل معها من 
خلال نظام البرمجيات الذي ينفذ نموذج برمجة -MapReduce‏ 

حيث يقوم نظام MapReduce‏ أولًا بقراءة ملف المدخلات وتقسيمه إلى عدة أجزاء. وف هذا 
«JUI‏ هناك نوعان من التقسيمات» بينما على أرض الواقع» عادةً ما يكون عدد التقسيمات أعلى من 
ذلك بكثيرء ومن تم تتم معالجة هذه التقسيمات عن طريق برامج 1325 المتعددة والتي تعمل 
بالتوازي على عُقد المجموعة. وفي هذه الحالة يكون دور كل برنامج هو تجميع وتقسيم البيانات 
حسب اللونء MapReduce elis esà e$‏ بأخذ مخرجات كل برنامج ودمج (خلط / فصل) نتائج 
المدخلات إلى برنامج التقليص؛ والذي يقوم بحساب مجموع عدد المربعات لكل لون. وفي هذا المثاله 
يتم استخدام نسخة واحدة فقط من برنامج التقليص, غير أنه من الناحية العملية قد يكون هناك 
المزيد من النُسخ. ويمكن للمبرمجين توفير برنامج الخلط / الفصل الخاص بهم؛ من أجل تحسين الأداء 
كما يمكنهم أيضًا نشر أداة الدمج التي تجمع بين ملفات مخرجات الخريطة المحلية؛ وذلك لتقليل عدد 
ملفات المخرجات التي يجب الوصول إليها عن بُعد عبر المجموعة عن طريق خطوة الخلط / الفصل. 
لمlذ|‏ }خم MapReduce؟‏ 

يقوم Map Reduce‏ مساعدة ال منظمات في معالجة وتحليل كميات كبيرة من البيانات متعددة 
المراحل. وتنطوي أمثلة التطبيق على الفهرسة والبحثء والتحليلات البيانية. وتحليلات النصء 
وتعلم الآلة» وتحويل البيانات وهكذا. وغالبًا ما تكون هذه الأنواع من التطبيقات صعبة التنفيذ 
باستخدام .501 القياسية المستخدمة بواسطة DBMSS‏ العلائقية. 

إن طبيعة 601068م312 الإجرائية تجعله سهل الفهم بواسطة المبرمجين ذوي اللهارة. كما 
أنه أيضًا له ميزة أخرى وهي أن المطورين ليسو مُلرّمِين بالاهتمام بتنفيذ الحوسبة المتوازية, 
حيث يتعامل النظام مع هذا الأمر بشفافية. وعلى الرغم من أن MapReduce‏ تم تصميمه من 
أجل المبرمجينء إلا أن غير المبرمجين يمكنهم أيضًا استغلال قيمة كل من MapReduce Oläuhs‏ 
ومكتبات الوظائف. وتتوفر مكتبات ع160106م112 سواء المدفوعة أو المجانية والتى توفر نطاقًا 
واسعًا من القدرات التحليلية. فعلى سبيل المثال» Apache Mahout às 9 aes‏ هى مكتبة 
تعلم آلي مجانية ل ”خوارزميات التجميع والتصنيف والترشيح التعاوني المستند إلى الدفعة“ التي 
يتم تنفيذها -MapReduce elaszb‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري w‏ 


الفصل السابع 


5 e BEES :Hadoop 


Saroe Hadoop. 
يعتبر 112000 إطار عمل مجاني لمعالجة: وتخزين» وتحليل كميات ضخمة من البيانات‎ 
Yahoo |Je Doug Cutting (3 (ys à).JI $ Hadoop elis] المتفرقة وغير المهيكلة. وقد تم‎ 
وقد تم استخلاص فكرة تقنية 112000 من ع60116خ1م1/12 والذي هو عبارة عن دالة محددة‎ 
بواسطة المستخدم ومطورة بواسطة جوجل في بدايات الألفية الثانية من أجل فهرسة الويب. وقد‎ 
تم تصميمه للتعامل مع البيتابايتس والإكسابايتس الخاصة بالبيانات التي تم توزيعها عبر عقد‎ 
متعددة في نفس الوقت. وتعمل مجموعات م118100 على أجهزة مواد غير مُكلقّة بحيث يمكن‎ 
توسيع نطاق المشرعات دون اللجوء للبنك. وقد أصبح م112000 الآن مشروعًا لتأسيس برمجيات‎ 
المئات من المساهمين باستمرار على‎ aso Cu «Apache Software Foundation أباتشي‎ 
بتجزئة البيانات الضخمة‎ 140٥ تحسين التقنية الأساسية. وتتمثل الفكرة الأساسية في: قيام‎ 
إلى أجزاء متعددة بحيث يمكن معالجة كل جزء وتحليله في نفس الوقتء بدلا من كثرة التخبط‎ 
في مجموعة ضخمة من البيانات باستخدام جهاز واحد.‎ 


كيف يعمل $Hadoop‏ 


يقوم العميل بالوصول إلى البيانات غير المهيكلة وشبه المهيكلة من المصادر بما في ذلك ملفات 
da‏ وإشعارات وسائل التواصل الاجتماعي» ومخازن البيانات الداخليةء ثم يقوم بتقطيع البيانات 
إلى «أجزاء»» وهذه الأجزاء يتم تنزيلها بعد ذلك في نظام ملفات يتألف من عُقد متعددة تعمل 
على أجهزة مادية. وأما مخزن الملفات الافتراضي في 112000 فهو نظام ملفات م118400 à... ELI‏ 
y a5 .HDFS si Hadoop Distributed File System‏ الجدير بالذكر أن أنظمة الملفات مثل 
نظام 12۴5 هي أنظمة بارعة في تخزين كميات ضخمة من البيانات غير المهيكلة وشبه المهيكلة 
نظرًا لأنها لا تتطلب تنظيم البيانات في الصفوف والأعمدة العلائقية. حيث يتم نسخ كل «جزء» 
عدة مرات ثم يتم تنزيله في نظام الملفات بحيث إذا سقطت Suit‏ يكون هناك عُقدة أخرى لديها 
نسخة من البيانات الموجودة على العقدة التي سقطت. وتعمل عقدة الاسم كمسهلء فهي ترجع إلى 
معلومات العميل مثل العّقد المتاحة» حيث تتواجد بيانات معينة في المجموعة, والعٌقد التي سقطت. 

وبمجرد تنزيل البيانات في المجموعة: فإنها تكون جاهزة للتحليل من خلال إطار عمJ .MapReduce‏ 
ويقوم العميل باختيار وظيفة ”م812“ - وعادةً ما تكون عبارة عن استعلام مكتوب بلغة 808[ - 


wry‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


إلى إحدى عُقد المجموعة والمعروفة على أنها متعقب الوظائف. حيث يشير متعقب الوظائف إلى 
عقدة الاسم لتحديد البيانات التي يحتاج إليها للوصول إلى إكمال هذه الوظيفة والمكان الموجود في 
ا مجموعة التي توجد فيها البيانات. وعند تحديد ذلك يقوم مُتَعَقب الوظائف بإرسال الاستعلام إلى 
العّقد ذات الصلة. وبدلًا من إعادة إدخال جميع البيانات إلى موقع مركزي من أجل اممعالجةء فإن 
المعالجة تحدث في كل عقدة في وقت واحد أو بشكل متواز. وهذه سمة أساسية خاصة ب .Hadoop‏ 
وعندما تنتهي كل عقدة من معالجة مهمتهاء فإنها تقوم بتخزين النتائج. ويقوم العميل 
بوظيفة ”التقليص“ من خلال متعقب الوظائف حيث يتم تجميع نتائج مرحلة الخريطة المخزنة 
داخليًا على العٌقد الفردية لتحديد «الإجابة» على الاستعلام الأصليء وعندئذ يتم تنزيلها على عقدة 
أخرى في المجموعة. وبوصول العميل إلى هذه النتائج. والتي يمكن تنزيلها بعد ذلك في واحدة 
من العديد من البيئات التحليلية من MapReduce àà,bs 9553. alles Jo‏ قد اكتملت. 
ومجدد أن تكتمل MapReduce äl> js‏ فإن البيانات المعالجة تصبح جاهزة لإجراء المزيد 
من التحليلات بواسطة علماء البيانات وغيرهم من أصحاب المهارات المتقدمة لتحليل البيانات. 
حيث يستطيع علماء البيانات التحكم فيها وتحليلها مستخدمين أي عدد من الأدوات لأي عدد 
من المرات» ها في ذلك البحث عن الأفكار والأماط الخفيةء أو استخدامها كأساس لبناء تطبيقات 
تحليلية تواجه المستخدم. كما يمكن أيضَا تصميم البيانات ونقلها من مجموعات م118000 
إلى قواعد البيانات العلائقية» ومستودعات البيانات» وأنظمة تقنية المعلومات التقليدية الأخرى 
لإجراء مزيد من التحليل و / أو لدعم معالجة المعاملات. 
مكونات 1400p‏ الفنية: 
تتكون ”حزمة“ م113000 من عدد من المكونات» والتي تشمل: 
- نظام ملفات 112400 المقسمة (112755): وهي طبقة التخزين الافتراضية في أي مجموعة 
محددة من مجموعات م112000. 
- عقدة الاسم: وهي العقدة في مجموعة م118100 التي توفر معلومات العميل فيما يتعلق بمكان 
مستودعات البيانات الخاصة با مجموعة وما يتعلق بحالة ما إذا فشلت إحدى العقد. 
- العقدة الثانوية: وهي نسخة احتياطية من اسم العقدة ففيها يتم إجراء نَسْخْ متماثل بشكل 
دوري ومستودعات البيانات من عقدة الأسماء في حالة فشلها. 
- مُتعقب الوظائف: وهو عبارة عن العٌقدة في مجموعة sã ilg Hadoop‏ بافتتاح وتنسيق 
وظائف M4p۸ duce‏ أو معالجة البيانات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wr‏ 


القصل السابع 


- العْقد التابعة: وهي العمق الخاص بأي مجموعة م118000 وتقوم العقد التابعة بمستودعات 
البيانات واتخاذ التوجيه معالجتها من متعقب الوظائف. 

وبالإضافة إلى هذه المكونات» فإن النظام البيئي م113000 يتكون من عدد من المكونات 
الفرعية التكميلية. فهناك مخازن البيانات 1[ 71050 مثل 025500078 و18 والتي تستخدم 
LA‏ لتخزين نتائج وظائف ععنالعخ1م112 في م512000. وإلى جانب لغة 258[ فإن هناك لغة 
Pig‏ وهي لغة متاحة مجانًا ومصممة خصيصًا من أجل م٥140‏ وتُستخدم لكتابة بعض 
Hive JU:s 9l GS .Hadoop LJ .s,5VI cà 5U54Jls MapReduce cà 5l55‏ وهو عبارة عن 
مستودع بيانات مجاني يسمح بالنمذجة التحليلية داخل 1184007 وقد تم تطويره في الأصل 
بواسطة >1ههاءء82. وفيما يلي مكونات 14٥٥p‏ الفرعية الأكثر شيوعًا. 

۷e‏ 111778 هو عبارة عن إطار عمل للمستودعات البيانات القائم على 1400p‏ وقد تم 
تطويره من قبل 18260001 وهو يسمح للمستخدمين بكتابة الاستعلامات بلغة مثل /1[ 50 وتسمى 
11٣‏ والتي يتم تحويلها بعد ذلك إلى «MapReduce‏ مما يسمح لمبرمجي ,501 الذين ليس 
لديهم خبرة ب ٤٠۸م‏ باستخدام امستودع وجعله أسهل لدمجه مع ذكاء الأعمال وأدوات 
التمثيل Revolutions Analyticsg <Tableaug Microstrategy :Jis $b‏ وغير ذلك. 

©: وهي عبارة عن لغة استعلام قائمة على م118000 تم تطويرها بواسطة 200هآ وهي 
سهلة التعلم نسبيًا كما أنها بارعة في امتدادات البيانات الطويلة جدًا والعميقة للغاية (حدود .5©[1). 

HBASE 5| :HBASE‏ هي قاعدة بيانات غير علائقية تتيح عمليات بحث سريع في 
à Hadoop gab,‏ وقت قليلء كما أنها تضيف إمكانيات المعاملات إلى م112000: مما يسمح 
للمستخدمين بإجراء التحديثات» وعمليات الحذف والإضافة. ويستخدم كل من 'إ82© و 
ع001اء136 قاعدة بيانات 11845175 بكثرة. 

M٤‏ وهو إطار عمل لتغذية م5]2000 بالبيانات. حيث يتم ملء كل مكان في البنية 
الأساسية لتقنية المعلومات تقنية المعلومات بالعملاء - داخل خوادم الويب» وخوادم التطبيقات» 
وأجهزة الجوال - على سبيل المثال: لجمع البيانات ودمجها في -Hadoop‏ 

22158 وهو نظام معالجة سير العمل الذي يسمح للمستخدمين بتحديد سلسلة من 
الوظائنف المكتوبة بلغات متعددة مثل ع16ا60خ1م2/13, وع1: وع1117ومن ثم ربطها ببعضها 
البعض بذكاء. حيث يتيح 0216 للمستخدمين تحديد أشياءء. مثل: أنه لايتم طلب استعلام 
خاص إلا بعد انتهاء الوظائف السابقة المحددة التي يعتمد عليها من أجل البيانات. 


we‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


:AMBARI‏ وهي مجموعة من الأدوات التي تعتمد على الويب لنشر مجموعات عداع ةمه 
م118000 وإذارتهاء ومراقبتها. ويقوم بقيادة تطويرها مهندسون من شركة هورتنورك 
ilg (Hortonworks)‏ تشتمل على 4705311 في منصة بيانات هورتنورك الخاصة بها. 

0٥‏ وهو نظام تسلسل البيانات الذي يسمح بترميز مخطط ملفات م118000آ. وهو 
بارع في تحليل البيانات والقيام بإزالة استدعاءات الإجراءات. 

41 : وهي مكتبة للتنقيب في البيانات» وهي تستخدم أكثر خوارزميات جمع البيانات انتشارًا 
للقيام بالتجميع» واختبار الانحدارء والنمذجة الإحصائية» وتنفيذ كل ذلك „MapReduce g354 ela&zab‏ 

202 : وهو أداة اتصال لنقل البيانات من مخازن بيانات غير 113000 - مثل قواعد 
البيانات العلائقية ومستودعات البيانات - إلى Hadoop‏ وهو يسمح للمستخدمين بتحديد موقع 
الهدف داخل م112400 فضلًا عن إرشاد م5000 لنقل البيانات من 0816 أو تيراداتاء أو غيرها 
من قواعد البيانات العلائقية إلى الهدف. 

© وضى عبارة عن إدارة مركزية للبيانات الوصفية 126430248 ومشاركة 
الخدمات ل barga Äi ga yag Apache Hadoop‏ لجميع البيانات في مجموعات 
م118000 كما تتيح أدوات متنوعة تتضمن كلا من 218 و51176: ملعالجة أي عناصر بيانات دون 
الحاجة إلى معرفة مادية مكان مستودعات البيانات في المجموعات. 


Hadoop‏ الإيجابيات والسلبيات: 

Jia‏ ام ميزة الأساسية ل و٥140‏ في أنه يسمح للمشاريع بمعالجة وتحليل كميات كبيرة 
من البيانات غير المهيكلة وشبه المهيكلة» والتي يتعذر الوصول إليها حتى الآنء بطريقة فعالة 
من حيث التكلفة والوقت. ونظرًا لأن مجموعات م118000 يمكنها الوصول إلى البيتابايتس 
وحتى الإكسابايتس من البيانات» فإن المشاريع لم تعد بحاجة إلى الاعتماد على مجموعات عينات 
البيانات ولكن يمكنها معالجة وتحليل كل البيانات ذات الصلة. ويمكن لعلماء البيانات تطبيق 
تدخل الحلقات التكراريةء حيث إن تنقيح واختبار الاستعلامات باستمرار يؤدي إلى الكشف عن 
أفكار لم تكن معروفة مسبقًا. أيضًا من مميزات م118000 أن البدء في استخدامه لا يحتاج إلى 
تكلفة عالية» بالإضافة إلى أن ال مطورين يمكنهم تنزيل تقسيمات elg Óla Apache Hadoop‏ 
بتجريب م118000 في أقل من يوم واحد. 

أما السلبيات الخاصة ب م118000 ومكوناته المتعددة فهي تتمثل في أنه لم يصل إلى مرحلة 
النضج كما أنه لازال في تطور حتى الآن. وكما هو الحال مع أي تقنية ناشئة وغير ناضجة» فإن 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wo‏ 


الفصل السابع 


تنفيذ وإدارة مجموعات م1128000] بالإضافة إلى إجراء تحليلات متقدمة على كميات ضخمة من 
البيانات غير المهيكلة يتطلب خبرةً ومهارةً 35 Ca‏ عاليًا. ولسوء adl‏ فإنه في الوقت الحالي 
هناك ندرة في مطوري م118000 وعلماء البيانات» مما يجعل الحفاظ على مجموعات م112000 
المعقدة والاستفادة منها أمرًّا ليس عمليًا. وبالإضافة إلى ذلك فإنه مع تحسين مكونات Hadoop‏ 
العديدة في ال مجتمع» وتكوين المكونات الجديدة: فإن هناك خطورة من التفرع» وذلك كما هو 
الوضع مع أي تقنية / منهج مجاني غير ناضج. وفي النهاية. فإن sa Hadoop‏ عبارة عن إطار 
موجه بالدفعات» بمعنى أنه لا يدعم معالجة وتحليل البيانات بشكل فوري. 

وا مفاجأة السارة أن بعض ألمع العقول في مجال تقنية ا معلومات يساهمون في مشروع ۸۲٤1‏ 
«Hadoop‏ وفضلًا عن ذلك فإن هناك luo Ío‏ من مطوري م112000 ومن علماء البيانات ممن هم 
في مقتبل العمر. ونتيجة لذلك؟ تتقدم التقنية بسرعة لتصبح أكثر قوة وأسهل في التنفيذ والإدارة. وأما 
النظام البيئي للموردين: فإنه يتمثل في عمل كل من 1011560-م118000 والشركات حديثة الظهور 
Cloudera Jia‏ وHortonworks‏ والشركات الرائدة ف تقنية المعلومات مثل أي (BM) el à‏ 
(Microsoft) C35 55 Sols‏ وتيراداتا ja JS säd (Oracle) dSbsls (Teradata)‏ توزيعات 
1400p‏ الجاهزة للشركات» والأدوات» والخدمات التجارية وذلك لجعل نشر التقنيات وإدارتها واقعًا 
عمليًا للمؤسسة التقليدية. وتعمل الشركات الناشئة الأخرى والتي هي في مقدمة التقنيةء على تحسين 
مخزون البيانات .110501 (ليس فقط .50[1) القادر على تقديم أفكار قريبة فوريًا مع 812000. 
وتقدم رؤية فنية )١-۷(‏ بعض الحقائق لتوضيح بعض المفاهيم الخاطئة -Hadoop Js‏ 

رؤية فنية 5-١‏ 
توضيح بعض الحقائق الغامضة الخاصة بهادوب 

على الرغم من وجود هادوب والتقنيات ال مرتبطة به منذ أكثر من ه سنوات» لازال معظم الناس 
يؤمنون ببعض اطفاهيم الخاطئة حول هادوب والتقنيات اممرتبطة به مغJ: .Hiveg MapReduce‏ 
وسوف تقدم القائمة التالية والتي تتكون من ٠١‏ حقائق توضيحًا ماهية هادوب وما يقوم به بالنسبة 
إلى ذكاء الأعمالء وكذلك حالات الأعمال والتقنية التي بإمكانها الاستفادة من ذكاء الأعمال ومستودعات 
البيانات والتحليلات القائمة على هادوب (2013 ,صoءو۸u).‏ 

الحقيقة # :١‏ يتألف هادوب من برامج متعددة. دائمًا ما نتتحدث عن هادوب كما لو أنه برنامج 
واحد مترابط» في حين أنه في الواقع عبارة عن عائلة من المنتجات والتقنيات المجانية والتي تشرف عليها 
مؤسسة برنامج #اعةم4 (855). وتتوفر بعض منتجات هادوب أيضَا من خلال توزيعات الموردين؛ 
وسيتم تقديم المزيد عن ذلك لاحقًا. 


wa‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


وتشمل مكتبة Apache Had00p‏ (ي ذكاء الأعمال حسب الأولوية): كلا من MapReduces .HDES‏ . 
Sqoops Flume |J! ááL2Jb .Zookeepers .Pigs .Hbases «Hiveg‏ وOozie»‏ وHue.‏ وما إلى ذلك. 
والتي يمكنك دمجها بطرق متنوعة: غير MapReduces HDFS ol‏ (عند دمجهم مع (Hives Hbase‏ 
قد يشكلان حزمة تقنية مفيدة لكل التطبيقات ف ذكاء الأعمال» ومستودعات البيانات» والتحليلات. 

الحقيقة # ؟: يتوفر هادوب مجانًا ومفتوح ا لمصدر لكنه متاح أيضًا من قبل ال موردينء حيث 
إن à ll Apache Hadoop el, à Ss‏ تكون متاحة من 4517 على .apache.org‏ وبالنسبة 
للمستخدمين الذين يرغبون في الحصول على حزمة أكثر جاهزية للمؤسسة: فإن عددًا قليلًا من الموردين 
الآن يقدمون تقسيمات هادوب التي تتضمن أدواتٍ إدارية إضافية És Gess‏ 

الحقيقة # : يعد هادوب نظامًا بيئيّه وليس منتجًا مستقلًا؛ إذ يشتمل نظام هادوب البيئي على 
قائمة متزايدة من برامج الموردين التي تتكامل مع أو تنشر تقنيات هادوبء ولن تحتاج لأكثر من دقيقة 
واحدة على محرك بحثك المفضل لتكتشف ذلك. 

الحقيقة # »: يعتبر 112135 نظام ملفاتء وليس نظام إدارة قاعدة بيانات (281/15). ويُّعد هادوب 
نظام ملفات مقسمة ف المقام الأول ويفتقر إلى القدرات التي هكننا ربطها بنظام 08S‏ مثل الفهرسةء 
والوصول العشوائي إلى البيانات» والدعم ل 51. وهذا جید. نظرًا لأن نظام 1150115 يقوم بأشياء لا تستطيع 
قواعد البيانات العلائقية (0856) القيام بها. 

الحقيقة # 0: يتشابه 81۷٠‏ مع 51 ولكنه ليس هو 501 القياسي. ويقصر العديد منا نفسه على 
1 وذلك نظرًا لمعرفتنا الجيدة به بالإضافة إلى أن أدواتنا تتطلب ذلك. وبالنسبة لمن يعرفون لغة 
1 فإنهم يستطيعون تعلم الرمز اليدوي 81۷١‏ بسرعة» غير أن هذا لا يحل مشكلات التوافق مع 
الأدوات القائمة على :501. 

الحقيقة # :٦‏ هناك ارتباط بين هادوب وع1860016م2/12 غير أن هذا الارتباط لا يقتضي أن يحتاج كل 
منهما للآخر. وقد قام امطورون على جوجل بتطویر HDFS 3979 LS MapReduce‏ وهناك بعض 
أشكال 12۸٠٠٠‏ التي تعمل مع مجموعة متنوعة من تقنيات التخزين» ها في ذلك HDFS‏ وأنظمة 
المافات الأخرىء وبعض 1281/55 

الحقيقة # /!: يوفر È eSI MapReduce‏ التحليلات: وليس التحليلات في حد ذاتها؛ حيث MapReduce ù|‏ 
هو محرك تنفيذ أغراض عامة والذي يتعامل مع تعقيدات الاتصال بالش بكة» والبرمجة المتوازيةء واحتمال الخطأ 
لأي نوع من التطبيقات التي يمكنك من خلالها تقديم رمزء وليس مجرد تحليلات. 

الحقيقة ۸#: يدور هادوب حول تنوع البيانات» وليس فقط حول حجم البيانات. فمن الناحية 
النظرية» هكن لنظام 10۴5 إدارة التخزين والوصول إلى أي نوع من البيانات طامما مكنك وضع البيانات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1V‏ 


القصل السابع 


في ملف ونسخ هذا الملف إلى 12۴5. ونظرًا لأن هذا الأمر يبدو بسيطًا للغايةء كما أنه صحيح بصفة 
dole‏ فهذا هو ما يجذب العديد من المستخدمين ل 211015 -Apache‏ 

الحقيقة # 9: يعمل هادوب كمكمل لمستودعات البيانات؛ ونادرًا ما يكون بديلًا عنه. فقد صممت 
معظم المنظمات مستودعات البيانات الخاص بها من أجل البيانات المهيكلة. والعلائقية. مما يجعل 
من الصعب حصر قيمة ذكاء الأعمال من البيانات غير المهيكلة وشبه ال مهيكلة. ويقوم هادوب بتكميل 
مستودعات البيانات من خلال التعامل مع أنواع البيانات متعددة الهياكل والتي لا تستطيع معظم 
مستودعات البيانات (1175©) التعامل معها. 

الحقيقة # :٠١‏ يتيح هادوب أنواعًا عديدة من التحليلات. وليس فقط تحليلات الويب. فعلى الرغم 
من أن هادوب يقع عليه الكثير من الضغوط حول كيفية استخدام شركات الإنترنت له من أجل تحليل 
سجلات الويب وبيانات الويب الأخرىء إلا أنه توجد حالات أخرى يُستخدم فيها. فعلى سبيل المثال» 
تأمل البيانات الضخمة التي تأق من أجهزة الاستشعارء مثل: الروبوتات ف التصنیع» أو ۸۴1۲ في بيع 
التجزئة:» أو مراقبة الشبكة في المرافق العامة. كما يمكن للتطبيقات التحليلية القديمة التي تحتاج إلى 
عينات كبيرة من البيانات - مثل تجزئة قاعدة العملاء. والكشف عن الغش» وتحليل ا مخاطر - أن تستفيد 
من البيانات الضخمة الإضافية التي يديرها هادوب. وبالمثلء فإنه يمكن لبيانات هادوب الإضافية أن 
توسع نطاق المشاهدات ١‏ درجة من أجل إنشاء عرض أكثر اكتمالًا ودقة. 


:NoSQL 


ظهر نمط جديد من قاعدة البيانات ذات الصلة يسمى .710501 (ليس فقط ,.آ501), وهو مثل 
هادوب» حيث يعالج كميات ضخمة من البيانات متعددة الهياكل. ومع ذلكء فإنه في الوقت الذي يعد 
فيه هادوب ÉL‏ $ دعم التحليلات التاريخية على نطاق واسع» فإن قواعد بيانات N05@1‏ موجهة في 
معظمها (على الرغم o‏ أن هناك بعض الاستثناءات اممهمة)ء لتقديم بيانات منفصلة مخزنة بين كميات 
ضخمة من البيانات متعددة المراحل للمستخده النهائي وجعل تطبيقات البيانات الضخمة آلية. وتفتقر 
هذه الإمكانية بشدة إلى تقنية قواعد البيانات العلائقيةء وهذا يجعلها ببساطة لا تستطيع الحفاظ على 
مستويات أذاء التطبيقات ال مطلوبة في مقياس البيانات الضخمة. 

HBase «JUL بعض الحالات» يعمل كل من .710501 وهادوب معًا في نفس الوقت. فعلى سبيل‎ s 
المذكورة آنقّاء هي قاعدة بيانات 710501 منتشرة على غرار 81818016 600816 والتي غالبًا ما يتم نشرها‎ 
من أجل توفير عمليات بحث سريعة في هادوب‎ -Hadoop 4s Lai على رأس 511255: ونظام الملفات‎ 
ACID في وقت قليل. ويتمثل الجانب السلبي لمعظم قواعد بيانات :710501 اليوم في أنها تتعامل مع‎ 


WA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


(الانسيابية #أكء1دمهغ2: والاتساق 7عمع]وزدهمء. elI (durability ölhlş isolation JljæYlş‏ 
بالأداء وقابلية التوسع. كما يفتقر الكثير منها إلى وجود أدوات الإدارة والرصد الناضجة. ويتم التغلب 
على القصور في هذين الجانبين السلبيين بواسطة مجموعات ,70501 المجانية ومجموعة من الموردين 
الذين يحاولون تسويق قواعد بيانات :70501 المختلفة. وتشتمل قواعد بيانات ,710501 المتاحة 
حاليًا على 118256 وهل صددمهن. و2/02801(8 وماتاحطناءعف بالإضافة «CouchDB; .Riak |J!‏ و 
DynamoDB‏ وغيرها. وتعرض الحالة العملية (۳-۷) استخدام قواعد بيانات 1اN08Q‏ في LS „eBay‏ 
توضح الحالة العملية )٤-۷(‏ تطبيقًا للتواصل الاجتماعي حيث تم استخدام البنية الأساسية لهادوب 
لتجميع مجموعة من الرسائل على تويتر لفهم أي أنواع المستخدمين الذين يشاركون في أي نوع من 
الدعم لمرضى الرعاية الصحية الذين يبحثون عن معلومات حول الأمراض العقلية المزمنة. 
حالة عملية ۴-۷ 
حل البيانات الضخمة الخاص ب eBay‏ 
يُعد 68 هو أكبر سوق على الإنترنت في العالم» مما يتيح شراء وبيع أي شيء عمليًا. 
وقد تأسس هذا السوق ف عام ٨۱۹۹ء‏ حيث يربط ه8 بين أفراد مجتمع متنوع 
وتفاعلي من البائعين وا مشترين» فضلًا عن الشركات الصغيرة. الجدير بالذكر أن eBay‏ 
الجماعي له تأثير مذهل على التجارة الإلكترونية: فقد بلغت القيمة الإجمالية للسلع 
المباعة على موقع 683 نحو ۷۵,٤‏ ملیار eBay g35a eu dis Y. \Y ale ($ js»‏ 
خدمات لأكثر من ١١17‏ مليون مستخدم نشط كما يقدم أكثر من 60١‏ مليون عنصر للبيع. 
التحدي - دعم البيانات على نطاق واسع: 
تعد قدرة 8y‏ على تحويل كميات ضخمة من البيانات التي تنتجها إلى أفكار 
مفيدة تمُكّن عملاءها من استخلاصها مباشرة من الصفحات المتكررة, هي أحد مفاتيح 
نجاحه الاستثنائية. ولاستيعاب النمو الضخم في بيانات :688 - فإن مراكز البيانات 
التابعة له تقوم بأداء المليارات من القراءات والكتابات كل يوم - وبسبب زيادة الطلب 
على معالجة البيانات بسرعات عاليةء فقد احتاج موقع 'إ88© إلى حل ليس له اختناقات 
مثيلة» بالإضافة إلى أنه قابل للتوسع» وقيود المعاملات المرتبطة بنهج قواعد البيانات 
العلائقية الشائعة. أيضَّاء فقد كانت الشركة بحاجة إلى إجراء تحليل سريع على تشكيلة 
واسعة من البيانات المهيكلة وغير المهيكلة التي تم التقاطها. 
الحل - البيانات الفورية المتكاملة والتحليلات: 
إن متطلبات البيانات الضخمة جعلت J| Jäi eBay‏ تقنيات .22510501 وتحديدًا 
.DataStax Enterprise Apache Cassandra‏ وقد انجذب ه۵8 أيضًا إلى تحليلات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wa‏ 


الفصل السابع 


Apache Hadoop‏ المدمجة مع 1156م 8266 .DataStax‏ إلى جانب 025532012 التي 
تتميز بياناتها بالفئة عالية السرعة. وينطوي الحل على بنية تدريجية تجعل 84ء 
قادرًا على نشر مجموعات من 1156م:82]61 :]102635 المتعددة عبر عدة مراكز بيانات 
مختلفة باستخدام الأجهزة السلعية. والنتيجة النهائية هي أن موقع OVI eol eBay‏ 
قادرًا على معالجة كميات هائلة من البيانات بكفاءة عالية من حيث التكلفةء وبسرعات 
عالية di‏ عند سرعات عالية للغايةء كما أنه أصبح قادرًا على تحقيق أكثر مما كان قادرًا 
على تحقيقه مع نظام الملكية الأعلى تكلفة والذي كان يستخدمه. ويقوم ه8٠‏ حاليًا 
بإدارة جزء كبير من احتياجات مركز البيانات - أكثر من ١0١‏ تيرابايت من المخزون - في 
-DataStax Enterprises Apache Cassandra (a JS cle sazs‏ 

DataStax 54 eBay jl, 3 à 55» Cus) (JI d,3U2NI 4I. sol isl Ja 23s 
نطاق واسع. كلا من قابلية التطوير الخطية للحلء والأمل الكبير في‎ de Enterprise 
النجاح دون نقطة فشل واحدة: وأداء كتابة متميز.‎ 

التعامل مع حالات الاستخدام المتنوعة: 

يقوم '88ء باستخدام 1156م2:]61 :]102135 للعديد من حالات الاستخدام 
ا مختلفة. وتوضح الأمثلة التالية بعض الطرق التي تستطيع الشركة من خلالها تلبية 
احتياجات بياناتها الضخمة من خلال قدرات معالجة البيانات والتحليلات السريعة التي 
يوفرها الحل. وبطبيعة الحالء فإن (183© تجرب كميات ضخمة من سوير الكتابة» والتي 
ÄSÎ äi „hs DataStax Enterprise å->Jlzs ws Cassandra guhs ladis dgu‏ 
كفاءة من 4aL 23s .NoSQL sl RDBMS 4 sai; Ji isl‏ (ة8ء حاليًا أكثر من * 
مليارات من الكتابات يوميًا عبر مجموعات 02553018 المتعددة وأكثر من 0 مليارات 
من القراءات (معظمها غير متصل) يوميًا. 

وتنطوي حالة الاستخدام الواحدة التي يدعمها 156:م12]61 <1(2]25]0 على قياس 
بيانات 1837© الاجتماعية التي يعرضها على صفحات المنتج الخاصة به. ويقوم تقسيم 
DataStax Enterprise j Cassandra‏ بتخزين جميع المعلومات اللازمة لتقديم 
بيانات ل ”يحب“ و“يفضل“ و“يريد“ على صفحات منتجات (83©. كما يوفر نفس 
البيانات الخاصة بصفحة ”تفضيلاتك“ على موقع :(83© والتي تحتوي على جميع 
العناصر التي يحبها المستخدم أو يمتلكها أو يرغب في Cassandra (5e ga dil à‏ 
لصفحة ”تفضيلاتك“ كاملة. وتوفر إ88© هذه البيانات من خلال خاصية العدادات 
القابلة للتطوير المقدمة من Cassandra‏ 


E‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


وتّعد موازنة الأحمال وتوافر التطبيق من الجوانب المهمة لحالة الاستخدام الخاصة 
التي نحن بصددها. وقد أعطت DataStax Enterprise Jl>‏ )خطط مشروع eBay‏ 
المرونة التي يحتاج إليها لتصميم نظام يكن أي طلب مستخدم من الوصول إلى أي مركز 
بيانات» مع وجود مركز بيانات يحتوي على مجموعة واحدة DataStax Enterprise ja‏ 
يشمل هذه المراكز. وتساعد هذه السمة في التصميم على موازنة تحميل المستخدم 
الوارد والقضاء على أي تهديد محتمل للتوقف عن العمل. وتستطيع 84y‏ إجراء تحليل 
yle‏ السرعة مع القدرة على الحفاظ على مركز بيانات منفصل يعمل على تشغيل عقد 
هادوب من 4435( à& Yuàà es (V-V JS L2JI sl) DataStax Enterprise áàlo-‏ 
خط بيانات الأعمال التي تعمل على تزويد صفحات الويب التي يزورها العملاء. 


O ق‎ s 











Source: Data Stax. 


شکل ۷-۷: تطویر مرکز متعدد البیانات التابع ل: ۵8y‏ 


وتشمل حالة الاستخدام الأخرى شركة Qa)" (eBay åS àJ iiid iS rà ag) Hunch‏ 
الأذواق“ عناصر ومستخدمي yه8»‏ والذي يقدم توصيات للعملاء بناءً على اهتمامات 
المستخدمين. ويمثل موقع ة8 على الويب رسكا بيانيًا أساسيًا بين جميع امستخدمين 
والعناصر المعروضة للبيع. حيث يتم التقاط جميع الأحداث (اطمزايدةء والشراء والبيع» 
والسرد) من خلال أنظمة وتخزينها كرسم بياني في 0855880:2. ويرى التطبيق أكثر من 
مليون من الكتابات يوميًا ويحمل أكثر من ٤٠١‏ مليار قطعة من البيانات. 
وتستخدم yھ۵8‏ أيضًا (atx E٤۲5۲‏ للعدید من حالات استخدام السلاسل 
الزمنية والتي تعتبر معالجة كميات ضخمة من البيانات بشكل فوري أمرًا له أولوية قبل 
كل شيء. وهذا يتضمن تسجيل وتتبع الإشعار المتنقل (في كل مرة يرسل فيها ترهقاء 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري اعد 








الفصل السابع 


إشعارًا إلى جوال أو أي جهاز فإنه iSl J} ilayh (Cassandra $ daus pi‏ 
عن حالات الغش» وتسجيل طلب / استجابة 504 للتنزيل» وتحليلات وسجلات خادم 
RedLaser‏ )23( شركة أخرى شقيقة لشركة تزدقاء). 

ومن خلال الاطلاع على جميع حالات الاستخدام التي «SS‏ يكون الاشتراط الشائع هو 
مدة التشغيل. وتدرك yه8ء‏ تمامًا حاجتها إلى الحفاظ على أعمالها à‏ مكانة متقدمة بالإضافة 
إلى الانفتاح من أجل أعمالهاء 55« É uL 55» DataStax Enterprise‏ في ذلك من خلال 
دعمها لمجموعات عالية التوافر. يقول 72:1 37[ المهندس المخطط لمشروع '[88©: «علينا أن 
نكون على استعداد لتخطي الكوارث طوال الوقت. إنه لشيء رائع Cassandra eas Ol‏ 
بمراكز بيانات متعددة نشطة حيث هكننا قراءة وكتابة بيانات في أي مكان وف أي وقت». 

أسئلة للمناقشة: 

-١‏ اذا يحتاج 8y‏ إلى حل البيانات الضخمة؟ 

۲- ما هي التحديات» وما هو الحل المقترح» وما هي النتائج التي تم التوصل إليها؟ 
Source: DataStax. Customer case studies. datastax.com/resources/casestudies/eBay‏ 

(accessed July 2016). 


حالة عملية ٤-۷‏ 
فهم جودة ودقة معلومات دعم الرعاية الصحية على تويتر 

يستطيع جميع مستخدمي شبكة الإنترنت اليوم المساهمة بالمعلومات فضلًا عن 
الاستفادة من المعلومات أيضًا. وتُستخدم هذه القوة بطرق مختلفة. ويستطيع 
المستخدمون على منصات الشبكات الاجتماعية مثل 1501116 نشر معلومات عن أوضاعهم 
الصحية بالإضافة إلى تلقي المساعدة لأفضل طريقة لعلاج هذه الحالات الصحية. وقد 
استفسر العديد من المستخدمين عن جودة المعلومات المنشورة على منصات الشبكات 
الاجتماعية. وعلى الرغم من أن القدرة على نشر المعلومات الصحية على تويتر تبدو 
مفيدة للكثير من ا مستخدمين الذين يستخدمونها بقصد الحصول على الدعم لمرضهم. إلا 
أنه دائمًا ما يكون هناك شك حول صحة هذه المعلومات. خاصةً عندما يقوم بنشرها أفراد 
عاديون. وقد سأل العديد من المستخدمين: «كيف أتأكد وأثق في المعلومات التي يقدمها 

غير الخبراء حول كيفية التصرف في مسألة حيوية مثل حالتي الصحية؟» 
ما هي أنواع المستخدمين الذين يشاركون ويناقشون أي نوع معلومات؟ وهل 
يقوم المستخدمون الذين لديهم عدد كبير من المتابعين بمناقشة ومشاركة نفس نوع 


wey‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


المعلومات التي يناقشها ويشاركها المستخدمون الذين لديهم عدد أقل من المتابعين؟ 
يرجع عدد متابعي المستخدم إلى مدى تأثير المستخدم؛ إذ يتم قياس خصائص ال معلومات 
من حيث الجودة والموضوعية من التغريدة ا منشورة. وقد انبرى فريق من علماء 
البيانات لاستكشاف العلاقة بين عدد متابعي ا مستخدم وخصائص ا معلومات التي قام 
المستخدم -(Asamoah & Sharda, 2015) la o‏ 

الحل: 

تم التنقيب في البيانات من منصة تويتر باستخدام ۸۴1 التابع ل إ٤1W.‏ وقد قام 
علماء البيانات بتكييف نموذج اكتشاف المعرفة وإدارة البيانات من أجل إدارة وتحليل 
هذه المجموعة الضخمة من البيانات. وقد تم تحسين النموذج لإدارة وتحليل البيانات 
الضخمة ال مستمدة من منصة الشبكة الاجتماعية وتضمن مراحل اكتساب معرفة المجالء 
وتطوير منصة البيانات الضخمة الملائمة. والحصول على البيانات وتخزينهاء بالإضافة إلى 
تنظيف البيانات» والتحقق من صحتهاء وتحليلهاء كما تضمن النتائج والنشر. 

التقنية المستخدمة: 

تم استخراج التغريدات: وإدارتهاء وتحليلها باستخدام توزيع 01000612 الخاص 
.Apache Hadoop —‏ 55:255 إطار dle Apache Hadoop‏ العديد من المشاريع 
الفرعية التي تدعم أنواعًا مختلفة من أنشطة إدارة البيانات: مثل دعم المشروع الفرعي 
čel, äU Apache Hive‏ والكتابة: وإدارة بيانات التغريدات الضخمة. وقد استخدمت 
أدوات لتحليل البيانات مثل ندام©6 والذي استُخدم لتحليل الشبكات الاجتماعية Ry‏ 
للنمذجة التنبؤية. وقد قاموا بإجراء تحليلين متوازيين؛ تحليل الشبكة الاجتماعية لفهم 
الشبكة على المنصة واستخراج النص لفهم محتوى التغريدات التي نشرها ا مستخدمون. 

$425 Ib 

وكما ذكرنا سابقًاء فقد تم تجميع وتحليل تغريدات من كل المستخدمين المؤثرين وغير 
المؤثرين. وقد أظهرت النتائج أن جودة وموضوعية المعلومات التي ينشرها ا مستخدمون 
المؤثرون كانت أعلى من تلك التي ينشرها المستخدمون غير المؤثرين. كما وجدوا أيضًا أن 
المستخدمين المؤثرين كانوا مسيطرين على تدفق المعلومات في الشبكة وأن المستخدمين 
الآخرين كانوا أكثر جذيبًا لمتابعة رأيهم حول موضوع ما. وقد كان هناك اختلاف واضح 
بين نوع دعم المعلومات التي يقدمها المستخدمون المؤثرون مقابل غيرهمء حيث ناقش 
المستخدمون المؤثرون معلومات أكثر موضوعية فيما يتعلق بإدارة المرض كالتشخيص» 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wr‏ 


الفصل السابع 


do sols‏ والعلاجات الرسمية: في حين قدم المستخدمون غير المؤثرين معلومات أكثر 
حول الدعم العاطفي والطرق البديلة للتعامل مع مثل هذه الأمراض. وبالتاليء فقد كان 
هناك اختلاف واضح بين المستخدمين المؤثرين وبين غيرهم من المستخدمين غير المؤثرين. 

يصور علماء البيانات من منظور غير الخبراء إمكانية زيادة توفير الرعاية الصحية من 
خلال مساعدة المرضى على تحديد واستخدام الموارد القيّمة على الويب del os‏ إدارة حالتهم 
المرضية. وساعد هذا العمل أيضًَا على تحديد كيف يمكن لغير الخبراء اكتشاف موقع معلومات 
الرعاية الصحية التي قد لا تكون بالضرورة مفيدة لإدارة أوضاع المرضى الصحية وترشيحها. 

أسئلة للمناقشة: 

-١‏ ماهو الشاغل الرئيس لعلماء البيانات فيما يتعلق با معلومات الصحية التي يتم 
TTwitter | Ae Us 25‏ 

؟- كيف يضمن علماء البيانات أن تكون المعلومات المقدمة من غير الخبراء والتي 
تنشر على وسائل التواصل الاجتماعي» تحتوي بالفعل على معلومات صحية قيّمة؟ 

-Y‏ هل من المنطقي أن يشارك المستخدمون المؤثرون معلومات أكثر موضوعية بينما 
يكون تركيز المستخدمين غير المؤثرين على المعلومات الشخصية بشكل أكبر؟ وماذا؟ 
Sources: Asamoah, D., & Sharda, R. (2015). Adapting CRISP-DM process for social‏ 
network analytics: Application to healthcare. In AMCIS 2015 Proceedings. aisel.‏ 
aisnet.org/amcis 2015/bizAnalytics/GeneralPresentations/33/(accessed July 2016).‏ 


Sarasohn-Kahn, J. (2008). The wisdom of patients: Health care meets online social 
media. Oakland, CA: California HealthCare Foundation. 


أسئلة للمراجعة على القسم :٤-۷‏ 

-١‏ ما هي الخصائص المشتركة لتقنيات البيانات الضخمة الناشئة؟ 

$MapReduce gak -Y‏ وماذا يعمل؟ وكيف يقوم بعمله؟ 

sak -Y‏ هادوب؟ وكيف يعمل؟ 

ع- ما هي المكونات الرئيسة لهادوب؟ وما هي الوظائف التي يؤديها؟ 

5- ما هو .210501؟ وكيف يتناسب مع صورة تحليلات البيانات الضخمة؟ 


we‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


/ا-0 البيانات الضخمة ومستودعات البيانات: 

ليس هناك شك في أن ظهور البيانات الضخمة قد أدى إلى تغيير مستودعات البيانات وسوف 
يستمر في تغييرها بشكل كبير. وقد كانت مستودعات بيانات المؤسسات (الفصلين ١‏ و). حتى 
وقت قريب» هي محور جميع تقنيات دعم القرار. أما الآن فإن عليهم مشاركة أضواء الوافد 
gig «à aad‏ يتمقل قالات الخهة: الال الذي بطر فة (daa das gis [ls‏ 
استبدال مستودعات البيانات وتقنياتها الأساسية ۸28۸S‏ بالبيانات الضخمة وتقنياتها التمكينية 
مثل هادوب. وهل سنشهد تحديًا بين مستودع البيانات والبيانات الضخمة (أو من وجهة نظر 
التقنية» بين S(RDBMS3 gla‏ وفي هذا القتسم سوف نوضح سبب عدم وجود أساس لهذه 
الأسئلة» وعلى الأقل سوف نبرر أن مثل هذا الاختيار ليس انعكاسًا للواقع في هذا الوقت. 

وقد شهد العقد الماضي أو نحو ذلك تقدمًا ملحوظًا في مجال أنظمة دعم القرار ا معتمدة على 
الحاسب. والتي قد ا إليها الفضل إلى حد كبير في مستودعات البيانات والتطورات التقنية في 
كل من البرامج والأجهزة للحصول على البيانات وتخزينها وتحليلها. وكلما زاد حجم البيانات» تزداد 
إمكانيات مستودعات البيانات. وقد اشتمل بعض التقدم الخاص بمستودعات البيانات على كل 
من المعالجة المتوازية على نطاق واسع (الانتقال من واحد أو عدد قليل إلى العديد من المعالجات 
المتوازية)» وشبكات منطقة التخزين (حلول التخزين القابلة للتطوير بسهولة)» وتخزين الحالة 
الصلبةء ومعالجة قاعدة البيانات؛ وامعالجة في الذاكرة» والقواعد العمودية (التوجه بالعمود)» liag‏ 
كله مجرد غيض من فيض. وقد ساعدت هذه التطورات في الحفاظ على الحجم المتزايد للبيانات 
لتظل تحت السيطرة: بينما تقوم بخدمة احتياجات التحليلات الخاصة بصانعي القرار بفاعلية. 
وما ساعد على تغير المشهد في السنوات الأخيرة هو تنوع وتعقيد البيانات: مما جعل مستودعات 
البيانات غير قادرة على مسايرة التقدم. ومن الجدير بالذكر أن التنوع والسرعة هي التي أجبرت 
عام تقنية المعلومات على تطوير نموذج جديد وليس حجم البيانات» حيث يُطلق على هذا النموذج 
الآن «البيانات الضخمة». والآن بعد أن أصبح لدينا هذان النموذجان - نموذج مستودعات البيانات 
ونموذج البيانات الضخمة المتنافسان ظاهريًا على نفس الوظيفة - لتحويل البيانات إلى معلومات 
قابلة للتطبيق - فأي نموذج منهما سوف يفرض نفسه؟ وهل هذا سؤال عادل لطرحه؟ أم أننا نفتقد 
الصورة الكبيرة؟ ولذلك فإننا نحاول في هذا القسم إلقاء بعض الضوء على هذا السؤال امثير للاهتمام. 

وكما هو الحال بالنسبة للعديد من الابتكارات التقنية السابقةء فقد أثيرت ضجة حول نموذج 
البيانات الضخمة وتقنياته التمكينية مثل هادوب وع10116م212. فغير الممارسين كغيرهم من 
الممارسين قد طغت عليهم الآراء المتنوعة. E‏ ما ذكرة کJ Grahams Awadallah jn‏ (2012): 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wto‏ 


القصل السابع 


فإن الزاعمين بأن هادوب يحل محل قواعد البيانات العلائقية ويصبح هو مستودع البيانات 
الجديد لا يملكون البرهان على مزاعمهم. ومن السهل معرفة مصدر هذه الادعاءات لأنه يمكن 
تشغيل كل من هادوب وأنظمة مستودع البيانات بالتوازيء كما يمكن توسيع نطاقها إلى أحجام 
هائلة من البيانات. بدون مشاركة أي أسلوب بنائي. وأما على المستوى المفاهيميء فقد يعتقد المرء 
أنها قابلة للتبادل» في حين أنها ليست كذلكء وأن الاختلافات بين الاثنين تفوق أوجه التشابه. ولكن 
إذا لم تكن قابلة للتبادلء فكيف نقرر متى نستخدم هادوب ومتى نستخدم مستودع البيانات؟ 
حالات استخدام مه1]1200: 
كما سبق أن وضحنا في هذا الفصلء لقد كان ظهور هادوب نتيجة للتطورات الجديدة في 
تقنيات الحاسب وشبكة التخزين؛ حيث يوفر هادوب طبقة من البرامج التي تمتد عبر الشبكة 
eli] lagos dala‏ واحده وذلك بانس تخذاغ ابلكونات الماذيةاللخاسب كاساس. ويناء على 
ذلك» فإن هناك بعض الاختلافات الرئيسة التي تظهر بوضوح في هذا البناء منها: 
- يعتبر هادوب مستودعًا Ía‏ عن أنه يعمل على تنقية البيانات الأولية. 
- يعتبر هادوب أرشيفًا قويًا واقتصاديًا ونشطًا. 
ومن ثم» فإن هادوب يستحوذ على طرفي دورة حياة البيانات واسعة النطاق la‏ عندما تظهر 
البيانات الأوليةء وأخيرًا عندما تتراجع «SLE‏ ولكن لاتزال هناك حاجة إليها في بعض الأحيان. 
-١‏ هادوب كمستودع ومكان تنقية: نظرًا لأن أحجام البيانات الضخمة تصل من مصادر مثل 
أجهزة الاستشعارء والآلات» ووسائل التواصل الاجتماعي وتيارات النقرء فإن الخطوة الأولى 
تتمثل في التقاط جميع البيانات بطريقة دقيقة وتكلفة عملية. فعندما تكون أحجام البيانات 
ضخمة: فإن الإستراتيجية التقليدية للخادم ا مفرد لا تعمل لفترة طويلة. ومن ثم فإن تدفق 
البيانات في 12۴5 ينح مخططي المشروع المرونة التي هم في أمس الحاجة إليهاء حيث 
إنهم لا مكنهم فقط التقاط ٠٠١‏ تيرابايت ف اليوم الواحد» بل يمكنهم أيضًا ضبط تهيئة 
هادوب للأعلى أو للأسفل لمواجهة تدفق أو انخفاض البيانات ها يتناسب مع مقدارهاء وهذا 
يتحقق بأقل تكلفة ممكنة لكل جيجابايت نظرًا لاقتصاديات المصادر المفتوحة والاستفادة من 
المكونات المادية للحاسب. ونظرًا لأن البيانات يتم تخزينها على وحدة التخزين المحلية بدلا 
من شبكات منطقة التخزينء فإن الوصول إلى البيانات في هادوب يكون أسرع بكثير في كثير 
من الأحيانء كما أنه لا يعيق الشبكة بحركة التيرابايتس من البيانات. وبمجرد التقاط البيانات 
الخام» فإنه يتم استخدام هادوب لتنقيتها؛ حيث يمكن لهادوب أن يعمل بمثابة محرك موازي 


56 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


«محرك :8:11 على المنشطات». من خلال الاستفادة من تقنيات تحويل البيانات التجارية 
أو المكتوبة بخط اليد؛ إذ تتطلب العديد من هذه العمليات الخاصة بتحويل البيانات الأولية, 
تفكيك البيانات ذات الصيغة الحرة المعقدة وتحويلها إلى تنسيقات منظمة: وهذا ينطبق 
بشكل خاص على تيارات النقر (أو سجلات الويب) وتنسيقات بيانات الاستشعار المعقدة. 
وبناءً على ذلكء فإن المبرمج يحتاج إلى فصل الصالح عن الطالح (تنقية البيانات من كل ما 
ليس له أهمية) وتحديد ما هو قَيّم وسط هذا الصخب. 

Qa 4d Jim Gray (esl 401/1 هادوب كأرشيف نشط: في مقابلة أجريت عام ۲۰۰۲ مع‎ -Y 
ال ممكن معالجة الأقراص الصلبة كأشرطة. وعلى الرغم من أن أمر الاستغناء عن أرشفة الشريط‎ 
إلا أنه يتم إعادة توجيه بعض أجزاء عبء العمل‎ lg a المغناطيسي قد يستغرق عدة‎ 
الشريطية بالفعل إلى مجموعات هادوب. ويرجع هذا التحول لسببين أساسيين. أولهماء أنه‎ 
على الرغم من أن أمر مستودعات البيانات على الشريط قد يبدو غير مكلف إلا أن تكلفته‎ 
- الحقيقية تظهر مع صعوبة الاسترجاع. ولا يقتصر الأمر فقط على الساعات - إن لم تكن الأيام‎ 
التي تتطلبها البيانات المخزنة في وضع عدم الاتصال من أجل استرجاعهاء بل إن لفائف الشريط‎ 
نفسها عرضة للتدهور مع مرور الوقتء الأمر الذي يجعل من عملية فقدان البيانات حقيقة‎ 
واقعة ويجبر الشركات على استيعاب هذه التكاليف. ومما يزيد الأمور سوءًا هو تغير تنسيقات‎ 
الأشرطة كل عامين» مما يتطلب من المنظمات إما إجراء عمليات ترحيل هائلة للبيانات إلى‎ 
تنسيق الشريط الأحدث أو المخاطرة بعدم القدرة على استعادة البيانات من الأشرطة القدهة.‎ 
وأما الأمر الثاني» فقد تبين أن هناك قيمة لحفظ البيانات التاريخية على الإنترنت مع إمكانية‎ 

الوصول إليها بسهولة. وكما هو الحال في مثال تيار النقرء فإن الاحتفاظ بالبيانات الأولية على 

قرص (بكرات) اللف لفترة أطول يسهل على الشركات إعادة النظر في البيانات عندما يتغير السياق 
والقيود الجديدة التي تحتاج إلى تطبيقها. إن عملية البحث عن آلاف الأقراص باستخدام هادوب 
تكون أسرع وأكثر سهولة من اللف عبر مئات الأشرطة المغناطيسية. وبالإضافة إلى ما سبق؛ فإنه 
مع استمرار تضاعف كثافات الأقراص كل ١18‏ شهرًاء يصبح من المُجدي اقتصاديًا بالنسبة للمنظمات 
أن تحتفظ بالبيانات الخام أو المنقحة الخاصة بالعديد من الأعوام في 51115. ومن تم فإن شبكة 
تخزين هادوب تكون مفيدة في كل من المعالجة الأولية للبيانات الخام ومستودعات البيانات على 
المدى الطويل. فهو يُعد بحق «أرشيفًا نشطًا» نظرًا لأنه لا يقوم بمستودعات البيانات ويحميها 
فحسبء بل إنه أيضًا ممَكّن المستخدمين من استخلاص القيمة بسرعة وسهولة وبشكل دائم. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1EV‏ 


القصل السابع 


حالات استخدام مستودعات البيانات: 
لقد أصبحت قائمة المميزات المتوفرة في مستودع البيانات مذهلة بدرجة كبيرة. بعد مرور ما 

يقرب من ٠١‏ عامًا من الاستثمارء والتنقيةء والنمو. فقد بُنيت على تقنية قواعد البيانات العلائقية 

باستخدام المخططات ودمج أدوات ذكاء الأعمال» وتتمثل الاختلافات الرئيسة في هذه البنية في: 

RE‏ مستودع البيانات. 

- دمج البيانات التي توفر قيمة الأعمال. 

- أدوات ذكاء الأعمال التفاعلية للمستخدمين النهائيين. 

MySQL أداء مستودع البيانات: إن الفهرسة الأساسيةء الموجودة في قواعد البيانات المجانية» مثل‎ -١ 
لهي سمة فموذجية تُستخدم بغرض تحسين زمن استجابة الاستعلام أو فرض قيود‎ Postgres s 
على البيانات؛ حيث شمكن النماذج الأكثر تقدمًا مثل: طرق العرض الفعليةء وفهارس الانضمام‎ 
الإجمال» والفهارس ال مكعبةء وفهارس الانضمام المتفرق» من تحقيق مكاسب متعددة للأداء في‎ 
مستودعات البيانات. ومع ذلك فإن تحسين الأداء الأكثر أهمية حتى الآن المُحَسِن القائم على‎ 
التكلفة؛ حيث يقوم اخسن بفحص 51 الواردة ويقوم بدراسة خطط متعددة من أجل تنفيذ‎ 
SQL كل طلب بحث في أسرع وقت ممكن» حيث يستطيع تحقيق ذلك من خلال مقارنة طلب‎ 
لتصميم قاعدة البيانات وإحصائيات بيانات شاملة والتي تساعد على تحديد أفضل مزيج من‎ 
خطوات التنفيذ. ويبدو المحَسن في جوهره وكأنما لديه مبرمج عبقري يقوم بفحص كل استعلام‎ 
وضبطه من أجل الحصول على أفضل أداء. وبسبب عدم وجود مُحَسن أو إحصائيات ديموغرافية‎ 
للبيانات: فإن الاستعلام الذي يمكن تشغيله في دقائق قد يستغرق عدة ساعات» حتى مع وجود‎ 
العديد من الفهارس. ولهذا السببء فإن موردي البيانات يقومون باستمرار بإضافة أنواع جديدة‎ 
Gle من الفهارس» والتقسيم» والإحصائيات» بالإضافة إلى مميزات للمّحَسن. وعلى مدى الثلاثين‎ 
الماضية. كان كل إصدار للبرامج عبارة عن إصدار أداء. وكما سنلاحظ في نهاية القتسم الخاص‎ 
بهادوب» أنه (آي هادوب) يتفوق على مستودعات البيانات التقليدية في مجال أداء الاستعلام.‎ 

۲- دمج البيانات التي توفر قيمة الأعمال: وهي الالتزام بالإجابة على أسئلة الأعمال الأساسية في 
قلب أي مستودع. وتمثل البيانات المتكاملة: الأساس الوحيد المطلوب لتحقيق هذا الهدف. 
وأما سبب وجود مستودعات البيانات فيتمثل في سحب البيانات من مجالات تابعة متعددة 
بالإضافة إلى العديد من التطبيقات إلى مستودع واحد. ويتعين على مصممي غماذج البيانات 
ومهندسي استخراج» وتحويلء وتنزيل (:8:11) مع البيانات الوصفية (ميتاداتا) وأدوات 
تنظيف البيانات» والعمل الدقيق أن يقوموا بترشيد تنسيقات البيانات» وأنظمة المصدرء 


MA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


والمعنى الدلالي للبيانات لجعلها مفهومة وموثوقة, وهذا يساعد على إنشاء مفردات مشتركة 
داخل الشركة بحيث يتم قياس وفهم المفاهيم الأساسية مثل: «العميل»» و«نهاية الشهر»» 
و«المرونة السعرية» بشكل موحد. الجدير بالذكر أن تجميع البيانات وتنظيفها ودمجها كما 
هي في مستودع البيانات لا يتم إلا في مركز تقنية المعلومات بأكمله» وليس في مكان آخر. 

«Tableaug «MicroStrategy :Jژم‎ jم أدوات ذكاء الأعمال التفاعلية: تتيح آدوات ذكاء الأعمال‎ -٠ 
وغيرها من الأدوات للمستخدمين التجاريين إمكانية الوصول المباشر إلى أفكار‎ TBM Cognoss 
مستودع البيانات. فبدايةء يستطيع مستخدم الأعمال إنشاء تقارير بالإضافة إلى إمكانية إنشاء‎ 
تحليلات معقدة بسرعة وسهولة باستخدام هذه الأدوات. ونتيجة لذلكء فإن هناك اتجاهًا‎ 
في العديد من مواقع مستودع البيانات نحو الخدمة الذاتية للمستخدم النهائي. كما يستطيع‎ 
مستخدمو الأعمال بكل سهولة طلب تقارير أكثر مما توفره تقنية المعلومات. غير أن الأهم من‎ 
الخدمة الذاتية» هو أن يكون المستخدمون على دراية تامة بالبيانات؛ إذ يمكنهم تشغيل تقرير‎ 
واكتشاف ما فاتهم من مقياس أو فرز (الفلترة)» بالإضافة إلى إجراء تعديل وتشغيل التقرير‎ 
الخاص بهم مرة أخرىء كل ذلك في غضون دقائق. ولا شك أن هذه العملية تؤدي إلى حدوث‎ 
تغييرات كبيرة في فهم المستخدمين للأنشطة التجارية وعملية صنع القرار. وأول هذه التغييرات»‎ 
هو توقف المستخدمين عن طرح أسئلة تافهة ويبدأون بطرح أسئلة إستراتيجية أكثر تعقيدًا.‎ 
وبشکل عام» فإنه كلما كان التقرير أكثر تعقيدًا وإستراتيجية: زادت الأرباح والإيرادات ووفورات‎ 
التكاليف التي يجنيها المستخدم. وهذا من شأنه أن يحول بعض المستخدمين إلى «مستخدمين‎ 
أقوياء» في الشركة؛ حيث يصبح هؤلاء الأفراد عباقرة في إثارة قيمة الأعمال من البيانات بالإضافة‎ 
إلى توفير معلومات إستراتيجية قيمة للموظفين التنفيذيين. الجدير بالذكر أن كل مستودع‎ 
من المستخدمين الأقوياء.‎ ٠١ بيانات في أي مكان يحتوي على: من ؟ إلى‎ 


المجالات الرمادية (أي واحد من الاثنين سوف يقوم بأداء المهمة): 

على الرغم من وجود العديد من المجالات التي تميز واحدًا عن الآخرء فإن هناك أيضًا مجالات 
رمادية لا يمكن فيها #مييز مستودع البيانات عن هادوب بوضوح. ففي هذه المجالات» يمكن 
للأداة إما أن تكون الحل ا مناسب وإما أن تقوم بأداء مماثل أو وظيفة غير جيدة على المهمة التي 
في متناول اليد. ويعتمد اختيار واحدٍ دون الآخر على متطلبات وتفضيلات المنظمة. وفي العديد 
من الحالات» يعمل كل من هادوب ومستودع البيانات معًا في سلسلة إمداد المعلومات: وكما هو 
الحال في كثير من الأحيان: تكون إحدى الأداتين هى الأفضل لتحمل عبء عمل معين Graham)‏ 
Awadallah, 2012‏ &( ويوضح الجدول (/1-1) النظام الأساسي المفضل (واحد مقابل الآخر أو 
احتمال المساواة) في إطار عدد من المتطلبات المرصودة الشائعة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 59 


الفصل السابع 


DW jl» Hadoop Za (sl ela&ul vaso جدول ۱-۷: متی‎ 





المتطلبات مستودع البيانات هادوب 

وقت استجابة منخفض وتقارير تفاعلية بالإضافة إلى 014. u]‏ 

الالتزام يكون (vj ANSI Y+ -Y SQL lhis‏ 
معالجة أو استكشاف البيانات الخام غير المهيكلة. 
المحفوظات على شبكة الإنترنت بديلًا للشريط. 
التنظيف عالي الجودة والبيانات المتسقة. 
من ٠٠١‏ إلى ٠٠٠١‏ من المستخدمين المتزامنين. 
اكتشاف علاقات غير معروفة في البيانات. 
منطق عملية معقدة متوازية. 
تحليل 0217 المكثف. 

النظام والمستخدمون وحوكمة البيانات. 
العديد من لغات البرمجة المرنة التي تعمل بالتوازي. 
استكشافات 530000 غير المقيدة, وغير الخاضعة للحكم. 
تحليل البيانات المؤقتة. 

الأمان الشامل والامتثال التنظيمي. 











الجمع بين هادوب ومستودع البيانات: 
هناك العديد من السيناريوهات المحتملة والتي بموجبها يكون الجمع بين كل من هادوب 
وتقنيات مستودعات البيانات القائمة على 08S‏ العلائقية في الاستخدام» أكثر منطقية. وفيما 
ياي بعض هذه السیناریوهات (2012 ,ه1 :)W‏ 
-١‏ استخدام هادوب لتخزين وأرشفة البيانات متعددة الهياكل: وحينئذ يمكن استخدام موصل 
ل 18215 العلائقية من أجل التنقيب في البيانات المطلوبة من هادوب لتحليلها بواسطة 


.10 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 





















































مفاهيم وأدوات البيانات الضخمة 


5 العلائقية. فإذا كانت (81S‏ العلائقية تدعم MapReduce ci Slb‏ فإن هذه 
الوظائف يمكن استخدامها للقيام idas‏ الاستخراج. وعلى Aster- Jya OB JÈL duw‏ 
Hadoop‏ يَسْتَخْدم وظائف ءءu‏ ل٠۸‏ م2 541-۷ لتوفير تنزيل سريع للبيانات ثنائية الاتجاه 
.Aster Databases HDES a JS s‏ وعندئذ يمكن تحليل البيانات التي تم تنزيلها في 
قاعدة بيانات :]45 باستخدام كل من -MapReduces SQL‏ : 

۲- استخدام هادوب AAI‏ وتحويل؛ و / أو دمج البيانات متعددة الهياكل: ويمكن استخدام موصل مثل 
محول م45]6-112000 لاستخراج النتائج من معالج هادوب ل 28115 العلائقية من أجل تحليلها. 

-Y‏ استخدام هادوب لتحليل كميات ضخمة من البيانات متعددة الهياكل ونشر النتائج التحليلية: 
حيث يعمل هادوب في هذا التطبيق» بمثابة منصة للتحليلات غير أنه يمكن إرجاع النتائج مرة 
أخرى إلى بيئة مستودعات البيانات التقليدية» أو مخزن بيانات مشترك لمجموعة العمل أو 
واجهة مستخدم مشتركة. 

- استخدام نظام 178315 العلائقي الذي يوفر wga aws MapReduce OL!‏ 
استقصائية: حيث يستطيع علماء البيانات استخدام نظام 081۷S‏ العلائقي (مثل: نظام 
قاعدة بيانات إءاءA)‏ لتحليل مجموعة من البيانات الممهيكلة ومتعددة الهياكل (المحملة من 
هادوب) باستخدام مزيج يتكون من كل من معالج .501 ووظائف ع1160106م212 التحليلية. 

ه- استخدام أداة استعلام 7021-54 للوصول إلى البيانات وتحليلها: وهناء يتم تخزين البيانات 
في كل من هادوب 1782159 العلائقية. 


فهذه السيناريوهات تدعم البيئة التي يكون فيها كل من هادوب و181155 العلائقية 
منفصلين عن بعضهما البعض كما يتم استخدام برنامج الاتصال لتبادل البيانات بين النظامين 
(انظر الشكل ۸-۷). ومن المرجح أن تتجه الصناعة على مدى السنوات القليلة المقبلة نحو 
تقنيات هادوب المرتبطة بإحكام بالإضافة إلى تقنيات مستودع البيانات المستندة إلى نُظّم إدارة 
قواعد البيانات العلائقية على مستوى البرامج والأجهزة على حد سواء. حيث يوفر هذا التكامل 
العديد من الفوائدء والتي تشمل عدم الحاجة إلى تثبيت بالإضافة إلى صيانة أنظمة متعددة 
وتقليل حركة البيانات» وتوفير مخزن بيانات وصفية ميتاداتا واحد من أجل تطوير التطبيقات» 
فضلا عن توفير واجهة واحدة لكل من مستخدمي الأعمال والأدوات التحليلية. وقد قدمت 
المقالة الافتتاحية (القسم )1-١'‏ مثالا على كيفية دمج البيانات التي هي من مستودع البيانات 
التقليدي ومجموعتي البيانات المختلفتين وغير المهيكلتين والمُخزنتين في هادوب من أجل إنشاء 
تطبيق تحليلي للحصول على إحصاءات حول تفاعلات العميل مع الشركة قبل إلغاء الحساب. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 101 


الفصل السابع 


so ciag‏ فإن اهتمامك ينصب على الأفكار التي يمكنك استخلاصها من البيانات» وليس على 
ما إذا كانت البيانات مخزنة في مستودع بيانات مهيكل أو مجموعات هادوب. 


legacy 




















Sources: Teradatacorp. 


aled A-V JKS‏ بين Hadoop‏ ومستودعات البيانات 


أسئلة للمراجعة على القسم :0-١‏ 

-١‏ ما هي التحديات التي تواجه مستودعات البيانات والبيانات الضخمة؟ وهل نشهد نهاية عصر 
مستودعات البيانات؟ وماذا نعم أو SY SU‏ 

؟- ما هي حالات الاستخدام للبيانات الضخمة وهادوب؟ 

-٠‏ ما هي حالات الاستخدام ممستودع البيانات و۸588؟ 

ع- في أي السيناريوهات يمكن الجمع بين هادوب و11081/15؟ 


I-V‏ موردو ومنصات البيانات الضخمة: 
يتطور المشهد الخاص مموردي البيانات الضخمة باعتباره مالا تقنيّا جديدًا نسبيًا. وقد قام عدد 
من الموردين بتطوير تقسيمات هادوب الخاصة بهم» والتي يعتمد معظمها على توزيع 1۴٤2ص۸‏ 
المجاني ولكن بمستويات مختلفة من التخصيص. وهناك اثنان من قادة السوق في مجال التوزيع وهما: 
as (hortonworks.com) Hortonworks s (cloudera.com) Cloudera‏ بدأت Cloudera‏ 
بواسطة خراء البيانات الضخمة وا Jeff Hammerbachers «555a (22s Doug Cutting ea‏ 
عام البيانات السابق في موقع التواصل الاجتماعي l| Facebook‏ هورتنورك فقد اشتقت من همطها! 


or‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











مفاهيم وأدوات البيانات الضخمة 


حيث تقدم كلتا الشركتين عرض التدريب / الخدمات المدفوعة الأجر على مستوى المؤسسة كما تقدم 
برمجيات إدارة هادوب مسجلة الملكية» بالإضافة إلى التوزيع الذي تقدمه في الأساس. كما تقوم 
1م113 (ددمءمهد) - وهى منشأة أخرى في هذا المجال - بتقديم تقسيم هادوب الخاص بها والذي 
يكمل 11015 بنظام ملفات الشبكة الخاص بها (2155) من أجل تحسين الأداء. وقد تشاركت شركة 
EMC Greenplum‏ مع شركة M12۸‏ في إصدار تقسيم هادوب الخاص بهما في مايو ۲۰۱۱. وهذه 
الأمثلة لا تمثل إلا عددًا قليلًا من الشركات (القديمة والحديثة) التي تزاحم في المشهد التنافسي الخاص 
بأدوات ومقدمي الخدمات لتقنيات هادوب. 

وفي عام :7210501 فإن هناك عددًا من الشركات المبتدئة تعمل على تسليم إصدارات معتمدة 
تجاريًا من الصفات المميزة المختلفة الخاصة ب.20501. فعلى سبيل المثال» DataStax eai‏ 
نسخة تجارية من 03558018 تتضمن دعم المؤسسات والخدمات» فضلا عن التكامل مع هادوب 
والبحث عن المؤسسات المجانية عبر 5011 1:16626. ويقوم معظم موردو تكامل البيانات الخاصة, 
ما في ذلك Pervasive Software Informatica‏ بالإضافة إلى ٤0یہ Sy‏ بعمل جولات فی 
سوق البيانات الضخمة مع روابط هادوب والأدوات ال مكملة التي تستهدف تسهيل نقل البيانات 
على المطورين حول وداخل مجموعات هادوب. 

كما تشهد طبقة التحليلات في مجموعة البيانات الضخمة أيضًا تطورات مهمة. فعلى سبيل 
«Jill‏ توجد شركة ناشئة 5 4( .Datameer‏ وتقوم هذه الشركة بتطوير ما تقول عنه بأنه 
منصة ذكاء الأعمال «الكل في واحد» من أجل هادوب. بينما قام برنامج 10016001" المتخصص في 
تصوير البيانات بإضافة هادوب واتصال مستودع بيانات الجيل التالي مجموعة منتجاته. وفي 
.EMC Greenplum à 5,5 l8 «4 2435 Lög)‏ لديها كوس «Chorus‏ وهو عبارة عن ملعب 
لعلماء البيانات حيث quar eie‏ وتجربة» وتبادل كميات كبيرة من البيانات من أجل التحليل. 
وهناك موردون آخرون يركزون على حالات استخدام تحليلية Jis Gosa‏ :0111650 إلى جانب 
مُحرك تحليلات تجربة عملائها. ويعمل عدد من موردي ذكاء الأعمال التقليديين» وأبرزهم 
gy gol de MicroStrategy‏ تحليل البيانات الضخمة وكفاءة التقارير في منتجاتهم. 

كما أن مساحات تطبيق البيانات الضخمة تنمو أيضاء حيث تقدم العديد من الشركات 
تطبيقات مبنية للاستفادة من مجموعات هادوب وإطار 11601068م213. وتحتوي الأدوات 
المجانية مفتوحة المصدر مثل لغة برمجة :1 على العديد من الدوال المُنفذة للاستفادة من التنفيذ 
ا متوازي من خلال مجموعات. وعلى سبيل المثالء تقدم شركة 1563588 تطبيقات البيانات 
الضخمة كخدمة للعديد من الصناعات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 30 


الفصل السابع 


وفي الوقت نفسه. فقد شهد سوق مستودع بيانات الجيل التالي مؤخرًا تجربة دمج كبيرة. فهناك 
jl‏ بعة من الموردين القادة في Aster Datas .Verticas Greenplums Netezza asg Jlabl lis‏ 
والذین تم اندماجهم HP EMCs JBM g‏ وتيراداتاء على التوالي. وقد تم اندماج 152/0 
مع 2611. كما يلعب امموردون العمالقة 0,216 و1831 أيضًا في مساحة البيانات الضخمة. فقد 
تبنت ex Oracle‏ أدوات البيانات الضخمة باستخدام .Exalogics .Exadata‏ وأجهزة البيانات 
الضخمة: حيث يقوم جهاز البيانات الضخمة بدمج توزيع م112000 01006125 مع قاعدة بيانات 
اNoSQ1 Oracles‏ وأدوات تكامل البيانات. ويعتnد‏ ڊرnliج Apache (Je 18M% Big1Insights‏ 
a yé Hadoop‏ يشتمل على العديد من الوحدات الخاصة والتي تتضمن قاعدة البيانات «Netezza‏ 
InfoSphere Warehouses‏ وأدوات ذكاء الأعمال 008205: وإمكانيات 5855 للتنقيب في البيانات. 
كما يُقدم أيضًا تيارات 656دام10105 182/1: وبرنامج مصمم لتحليل تيارات البيانات الضخمة. ومع 
Watson analytics å jll 4l elz‏ فإن شركة 181/1 تقوم بطرح العديد من عروض التحليلات 
الخاصة بها بشكل عام وعروض البيانات الضخمة بشكل خاص تحت تصنيف 01181503 وقد نتج 
عن استحواذ تيراداتا على 45]65» تقديم منتج ("JI Teradata Aster 3 ole! js‏ تنفذ عددًا من 
وظائف التحليلات الشائعة الاستخدام في بيئة البيانات الضخمة. وفيما يلي سنقدم موجرًا عن بيئات 
(Teradata Asters .IBM's InfoSphere (4 JS‏ بالإضافة إلى تقديم حالة عملية قصيرة لكل منهما. 
وقد اخترنا تقديم هذين البرنامجين هنا تحديدًا نظرًا لأن كلا منهما يُعد من البرامج الناجحة تجاريًاء 
كما تتوفر لهم مواد تعليمية كثيرة والتي تتضمن البرامج القابلة للتنزيل. 


:IBM's InfoSphere BigInsights منصة‎ 


Apache ç g ia (Je 4$ iau IBM 45,2) z;UJI InfoSphere BigInsights Ax; :às4&a 
المجاني لتحليل البيانات المهيكلة التقليدية الموجودة في قواع د البيانات القديمة إلى‎ 512000 
جانب البيانات شبه ال مهيكلة وغير المهيكلة مثل النصوص,» والفيديوء والصوت» والصورء ووسائل‎ 
التواصل الاجتماعيء وسجلات الويب» وتيارات النقر. حيث تقوم المنصة بدمج العديد من‎ 
تطبيقات ع1660116م21/13 من خوارزميات التحليلات لتشغيل تطبيقات متوازية على نطاق واسع‎ 
وهو مصمم لتوفير تحليلات متقدمة عن تقنية هادوب التي تم تحسينها بشكل خاص من أجل‎ 
متطلبات تحليل البيانات الضخمة.‎ 
IBM InfoSphere أسلوب البناء: يعرض الشكل (1-7) المكونات المختلفة الخاصة ب‎ 
القياسي» وبالإضافة‎ Aمaءاe‎ Hadoop gl» IBM — BigInsights ès9 .BigInsights 
إلى ذلك فإنه يوفر أيضَا تقنيات فريدة ولغات برمجة إلى جانب التحليلات المدمجة ومُسرعات‎ 


10t‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


التطبيقات (مثل: النص» والجغرافيا ا مكانيةء والسلسلة الزمنية» والتنقيب في البيانات» والتمويل 
ووسائل التواصل الاجتماعيء وحدث الاتصالات» وبيانات الآلة) لتنفيذ العمليات المتخصصة 
بكفاءة من أجل تلبية متطلبات تحليل البيانات الضخمة. فعلى سبيل المثالء تم تصميم 14010 
Query Language‏ 150171) من أجل تحسين معالجة وتحليل بيانات ترميز pols (JSON)‏ 
JavaScript‏ شبه المهيكلة. وهذه الوظائف مفيدة بشكل خاص في تحليل تيارات بيانات تويتر. 
وتمثل 81656615 أداة نمط جدول البيانات التي تدعم استكشاف وتصوير البيانات القابلة للتوسع 
على جدول ,501 الضخم المستقر على 511(15. AQL) Annotation dàxlll eszayl às) e:u5s‏ 
COLS (Query Language‏ مدمجة من أجل تحليلات النصوص المتقدمة عبر كميات هائلة 
من المستندات شبه وغير المهيكلة. أما +8181 فهو عبارة عن برنامج للتحليلات واسعة النطاق 
على هادوب والذي تُمَكّن من الوصول إلى البيانات المستقرة على 12۴5 ومعالجتهاء وتحليلهاء 
وتصورهاء حسب واجهة المستخدم ۸. وأخب ولیس آخرًَ« ذlن‏ ÎدوIٽ InfoSphere BigInsights‏ 
Eclipse. .J‏ 0-54 المطورين من تطوير برامج لتعمل Vu» dnfoSphere BigInsights (JL e‏ 
تتضمن هذه البرامج معالجات» ومولدات الكودء وبيئة اختبار لتبسيط جهود تطوير التطبيقات. 
ومع توفر كل هذه الأدوات في برنامج واحد مستمرء يمكن تطوير ونشر التطبيق بسرعة في كتالوج 
5 القائم على الويب» ومن ثم استخدام وحدة تحكم خاصة بالويب لنشر التطبيق على 
مجموعات هادوب والسماح للمستخدمين الذين لديهم الصلاحية أن يصلوا إليه. 


Biginsighits ease jl 


EA GEH Ea (Nem) [Rue s 
Cie] ED C GERA Ca Ooze de am adh 








IBM Infosphere à» :3-V JS S 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 100 








الفصل السابع 


كيف تبدأ: يمكن تنزيل تجارب 8181516145 من الرابط: 


http://www.ibm.com/analytics/us/en/technology/hadoop/hadoop-trials.html 


كما أن إصدار البدء السريع من 8181051865 متاح للتنزيل مجانًا عبر 


http://www.ibm.com/developerworks/downloads/im/Biginsightsquick/ 
وهو يعالج مجموعة أحادية أو متعددة من المصدر المفقتوح م518000. كما يتطلب نظامًا‎ 
öll على الأقلء بالإضافة إلى معالج رباعي‎ 16 G8 يحتوي على ذاكرة وصول عشوائي تبلغ سعتها‎ 


و8 © 50 مساحة حرة. 


وأفضل مكان لبدء تعلم ما یخص iolsslzaJ IBM 55,2 JY io sa InfoSphere BigInsights‏ 
http://www.ibm.com/support/knowledgecenter/SSPT3X 2.1.2/com.‏ 
ibm.swg.im.InfoSphere.Biginsights.tut.doc/doc/tut Introduction.html.‏ 
وتقدم الحالة العملية (0-1) مثالًا يوضح كيف هكننا دمج البيانات من مصادر متعددة 


لتحليل تقارير الانفلونزا. 


101 


حالة عملية ٥-۷‏ 
استخدام وسائل التواصل الاجتماعي للتنبؤ الفوري بنشاط الانفلونزا 

تفرض الأمراض المعدية عبنًا كبيرَا على نظام الصحة العامة في الولايات المتحدة 
الأمريكية. وقد أدى ظهور فيروس نقص الناعة البشرية / الإيدز à HIV/AIDS‏ 
أواخر السبعينيات» وفيروس الانفلونزا 11۸1 في عام "٠١9‏ ووباء 213712 خلال 
موسم شتاء ١17‏ - 21701 وتفشَّي فيروس إيبولا 860012 في عام 27١10‏ بالإضافة إلى 
فيروس زيكا 7)4 الذي انتشر في عام ٠۲١٠١‏ إلى إثبات قابلية الناس للإصابة مثل 
هذه الأمراض ابعدية. ومن الناحية الفعليةء فإنه يحدث تفثَّي للانفلونزا كل عام 
بأشكال مختلفة وينتج عنها آثار متباينة. ويبلغ متوسط التأثير السنوي لتفشَّي فيروس 
الانفلونزا الموسمية في الولايات المتحدة ٠٠٠٠٠١‏ شخصًا ققد الحياة من أعمار مختلفة 
غير محصورةء و۲۱ مليون يوم ف امستشفىء» و٤,٠٠‏ مليون زيارة للعيادات الخارجية. 
وإجمالي ۸۷,١‏ مليار دولار كعبءٍ اقتصادي. ونتيجة لهذا الاتجاه المتزايد فقد ظهرت 
على الساحة في السنوات الأخيرة أساليب جديدة لتحليل البيانات بالإضافة إلى ظهور 
تقنيات قادرة على اكتشاف مثل هذه الأمراض وتتبعها ورسم خرائطها وإدارتها. وقد 
أعطت أنظمة المراقبة الرقمية بوجه خاصء وعودًا بقدرتها على اكتشاف أنماط البحث 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


عن الصحة العامة وتحويل هذه الاكتشافات إلى إستراتيجيات قابلة للتطبيق. 

وقد بين هذا المشروع أنه يمكن استخدام وسائل التواصل الاجتماعي كطريقة فعالة 
للكشف المبكر عن تفشي الانفلونزا. فقد استخدمنا منصة البيانات الضخمة لاستخدام 
بيانات 1۷6١‏ من أجل مراقبة نشاط الانفلونزا في الولايات ال متحدة. وقد تضمنت 
أساليبنا في تحليل البيانات الضخمة استخراج كل من الزمان» وامكان» والنص. فقد 
قمنا في التحليل الزمني بفحص ما إذا كان يمكن بالفعل تكييف بيانات 15016165 للتنبؤ 
الفوري بمدى تفش الانفلونزا. كما قمنا في التحليل المكانيء بتخطيط تفشي الانفلونزا 
للخاصية الجغرافية المكانية من بيانات تويتر لتحديد النقاط التي تؤثر فيها الانفلونزا 
بشكل فعال. وقد تم إجراء تحليلات النص للتعرف على الأعراض والعلاجات الشائعة 
للانفلونزا والتي تم ذكرها في التغريدات. 

وقد تم استخدام منصة 5]ا518م]818 ع61م10105 181/1 لتحليل مجموعتين من 
بيانات نشاط الانفلونزا؛ حيث استُخدمت بيانات تويتر لمراقبة تفشَّي الانفلونزا في الولايات 
المتحدة: بالإضافة إلى استخدام مستودع بيانات 5اء11621]12 6م06 لتتبع اللقاءات 
السريرية في العالم الحقيقي. وقد انتقل حجم ضخم من التغريدات المتعلقة بالانفلونزا 
من تويتر باستخدام 421 5662128 Twitter‏ حتى تم استيعابه في مجموعات 
هادوب. وبمجرد تلقي البيانات بنجاح» استخدمت JSON Query Language ölÎ‏ 
(JAQL)‏ لمعالجة وتحليل بيانات JSON) åhus àl JavaScript polie je‏ 
وبعد ذلك تم استخدام 1116 لهيكلة البيانات النصية وفصل المعلومات من أجل تحليل 
الموقع المكاني والزماني والتصوير في ۸. كما تم تنفيذ عملية التنقيب قي البيانات بالكامل 
باستخدام وظائف ٠e‏ ل٠14p۸.‏ وقد استخدمنا الحزمة 81۸ لتقديم نصوص ۸ عبر 
البيانات المخزنة في 811(55. حيث مكنتنا الحزمة 8181 من الاستفادة من الحساب 
المتوازي لنظام 111055 كما مكنتنا من إجراء عمليات ©1:6011م213. وقد استخدمت 
مكتبات 481 لخرائط جوجل كأداة رسم خرائط أساسية لتصوير مواقع التغريد. 

وقد أظهرت النتائج التي توصلنا إليها أن التكامل بين كل من وسائل التواصل 
الاجتماعي والسجلات الطبية يستطيع أن يكون مكملًا ذا قيمة لنظم المراقبة القائمة. كما 
أكدت نتائجنا أن الحركة المرتبطة بالانفلونزا على وسائل التواصل الاجتماعي ترتبط ارتباطًَا 
وثيقًا بتفشَّي الانفلونزا الفعلية. وقد أظهر ذلك أيضًا باحثون آخرون St Louis, Zorlu,)‏ 
Broniatowski, Paul, & Dredze, 2013‏ ;2012(. وقد أجرينا تحليل سلسلة زمنية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 10V‏ 


الفصل السابع 


للحصول على الارتباط المتبادل المكاني والزماني بين الاتجاهين (41) ولاحظنا أن مواجهات 
الانفلونزا الإكلينيكية تأتي خلف المشاركات عبر الإنترنت. وبالإضافة إلى ذلك. فقد كشف 
تحليل موقعنا عن عدة مواقع عامة نشأت من خلالها أغلب التغريدات. وهذه النتائج 
يمكنها ممساعدة ا لمسؤولين عن الصحة والحكومات على تطوير نماذج تنب أكثر دقة في 
الوقت المناسب أثناء حدوث التفشّيء وإبلاغ الأفراد حول المواقع التي يجب تجنبها خلال 


تلك الفترة الزمنية. 

أسئلة للمناقشة: 

-١‏ اذا تتستطيع وسائل التواصل الاجتماعي أن تكون بمثابة مؤشر مبكر على تفشّي 
الانفلونزا؟ 


b -Y‏ هي المتغيرات الأخرى التي قد تساعد في التنبؤ بمثل هذه التفشيات؟ 

as I0, -Y‏ هذه المشكلة مثالا [nes‏ يمكن حله باستخدام تقنيات البيانات الضخمة 
المذكورة في هذا الفصل؟ 
Sources: Zadeh, A. H., Zolbanin, H. M., Sharda, R., & Delen, D. (2015). Social‏ 
media for nowcasting the flu activity: Spatial- temporal and text analysis. Business‏ 
Analytics Congress, Pre-ICIS Conference, Fort Worth, TX. Broniatowski, D. A.,‏ 
Paul, M. J., & Dredze, M. (2013). National and local influenza surveillance through‏ 
Twitter: An analysis of the 20122013- influenza epidemic. PloS One, 8(12), e83672.‏ 


Moran, P. A. (1950). Notes on continuous stochastic phenomena. Biometrika, 1723-. 


منصة :Teradata Aster‏ 
Teradata Aster o| asis‏ هي منصة بيانات ضخمة للتخزين الموزع ومعالجة مجموعات 
البيانات الكبيرة متعددة الهياكل. وقد استخدمت هذه المنصة لتحسين التسويق» وكشف الاحتيالء 
كما استخدمت في التحليلات الرياضيةء وتحليل الشبكات الاجتماعية» بالإضافة إلى تحليلات البيانات 
«à VI‏ وتحليلات الطاقةء وتحليلات الرعاية الصحيةء والعديد من التطبيقات الأخرى. وقد قامت 
5161 18120318' بموازاة العديد من وظائف التحليلات التقليدية والمتقدمة: كما أن لديها قدرات 
لإجراء تحليل السلاسل الزمنيةء والتحليل الإحصائ» وتحليل الكتلة. والتنقيب في النصء بالإضافة 
إلى التنقيب في قاعدة dalil‏ وتحليل الشبكات الاجتماعية. والتحليلات المرئية, وتحليلات الموقع 
والتحلي لات التنبؤية؛ حيث تقوم بإجراء كل ذلك بطريقة موزعة. وبالإضافة إلى حزم التحليلات 
التقليدية: فإن 45167 16720318 لديها أيضًا العديد من حزم التحليلات الجديدة والفريدة لتحليل 

المسارء كما أنها متوافقة أيضًا مع لغات البرمجة الأخرى مثل ۸ء و«0طار Javas‏ 


^30 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


أسلوؤب Teradata Aster (2S5 e3 3) :eLJl‏ مع أسلوب بناء oolàJI master-slave‏ 3 
sag Apache Hadoop‏ يتكون من عقدة ملكة وعقد عامل متعددة وهى تعادل كلا من عقد 
الاسم وعقد البيانات في هادوب» على التوالي. ويقدم الشكل TD Aster sU gla] (\+-V)‏ 


Aster nCluster 





Sources: Teradata Corp. 
Teradata Aster à :V«-V JS S 
وتقوم عقدة ا ملكة في الطبقة العليا بإدارة النظام» والمخططء ومعالجة الأخطاءء وتوزيع الحساب‎ 
على العاملين. فهي تقوم بتنسيق الاستعلامات وإرجاع نتائج الاستعلام. أما الطبقة الوسطى من‎ 
البناء فهي تحتوي على العمال» حيث يقوم العمال بمستودعات البيانات باستخدام عامل التكرار‎ 
الذي يعينه المسؤول ومن ثم فإنهم يتحملون الأخطاء. ويتفاعل العمال مع بعضهم البعض لمعالجة‎ 
الاستعلامات التى تطلبها الملكة. ويتكون ال مستوى الثالث من البناء من عقدة مسؤول التنزيل والتى‎ 
i تستقبل البيانات من أطراف ثالثة مثل نظم المعلومات.‎ 
والذي همکنه استیعاب بیانات‎ Aster File Store وتشتمل بنية ۸5۲۲۲ 1۲ على متجر ملف أستر‎ 
متعددة مثل سجلات الويبء وبيانات جهاز الاستشعارء وبيانات سجل الآلة. وهو متوافق مع‎ 
وأنظمة الملفات التقليدية الأخرى. ويمكن أيضًا توصيل المجموعة بقواعد بيانات أخرى‎ 5 
إلى 5115 من خلال الروابط الأخرى المتاحة.‎ ááL5yG Teradata Warehouses «Oracle DB Js 
و‎ 8Q1 وبالنسبة لتحليل البيانات» فإن المستخدم يمكنه كتابة الاستعلامات التقليدية لكل من‎ 
TD J jb] SQL-MR 55s .SQL-Graph (SQL-GR)5 .SQL-MapReduce (SQL-MR) 
OL التحليلات في قاعدة بيانات 45]61. وبالمثل:‎ lbg jo MapReduce slof o$ والذي‎ Aster 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 10۹ 


القصل السابع 


501-61 يعتبر إطار عمل من أجل تمكين معالجة محرك الرسم البياني في ex Aster Olly ös‏ 
تنفيذ عملية الاستعلامات المكتوبة في SQL-GR si SQL-SQL-MR 5| SQL‏ تلقائيًا بشكل متوازي 
عبر المجموعة. وللوصول إلى قواعد البيانات وكتابة الاستعلامات» فإنه هكن للمستخدمين إما استخدام 
أداة Aster Command‏ (7عم)أو استخدام تطبيق من جانب العميل يسمى 561010 16120218. 
وتشتمل الحزمة الكاملة من ۲٠ا45‏ 12 على أداة تستند إلى متصفح الويب للتصوير ال مرفي 
-AppCenter (445‏ حيث يمكن استخدام ٣٤١٤۴۲‏ مم۸ لإنشاء أنواع مختلفة من التصويرات 
المرئية مثل مخطط (إع531: «sigma Ja lass‏ ومخطط ۲4٥1ء‏ وهيكل الشجرةء ومخطط 
ا لمجموعة الهرميةء وسحابة الكلمة. والمخطط الشريطيء والمخطط الدائري» وغيرها من الرسوم 
البيانية الإحصائية التقليدية الأخرى. 
كيف تبدأ: يتوفر الإصدار السريع من ]45 16620813 للتنزيل مجانًا. حيث يمكن تنزيل :]45 (11” 
Qo)lz Oe Os*o 99. .(https://aster-community.teradata.com) Js JI la 5a Express‏ 
افتراضيين: ملكة واحدة وعامل واحد. كما أنه يتطلب جهازًا لايقل عن ٤‏ 61 من الرامات «ذاكرة 
الوصول العشوائية». ويمكن للمستخدم تنزيل OS% LS Aster Express $ OLLI os GB W‏ 
الوصول إلى دليل البدء من خلال بوابة شبكة www.teradatauniversitynetwork.) bl3l;3 áxle-‏ 
صه»). وللوصول إلى الوثائق والتعليمات والتمارين ومجموعات البيانات من أجل تعلم 4ة ه٠1‏ 
alè Aster‏ يجب على oluv elis) cbl‏ على موقع ۲0۸ على الويب. 
وقد سبق أن رأينا أمثلة على استخدام ,]د45 1652028 في المقالة الافتتاحية في الفصل الأول 
في تحليلات الرياضة وأيضًا في بداية هذا الفصل. وتوفر الحالة العملية(-1) مثالا آخر على 
استخدام Teradata Aster‏ . 
حالة عملية ٠-۷‏ 
تحليل أنماط المرض من مستودع بيانات السجلات الطبية الإلكترونية 
لقد تم منح مركز gla OI‏ في الأنظمة الصحية في جامعة أوكلاهوما الحكومية, 
مستودعًا ضخمًا للبيانات من قبل شرکة Cerner Corporation‏ والتي هي عبارة عن 
مزود السجلات الطبية الإلكترونية الرئيسة (EMRS)‏ للمساعدة في تطوير التطبيقات 
التحليلية. حيث يشتمل مستودع البيانات على 52/1185 في زيارات أكثر من 0٠‏ مليون 
من المرضى الفريدين من نوعهم عبر مستشفيات الولايات المتحدة (1990 - 7-16). كما 
أنه يشمل أكثر من 66 مليون زيارة قاهرة وطارئة وإسعافية. فهي أكبر قاعدة بيانات 
علائقية وحيدة في هذه الصناعة والتي تشتمل على سجلات شاملة مع الصيدليات» 


n‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


وام مختبرات» والأحداث السريرية» والقبول وبيانات الفوترة. كما تشتمل قاعدة البيانات 
على أكثر من ۲,٤‏ مليار نتيجة معملية وأكثر من 790 مليون طلب لما يقرب من 60٠٠‏ 
علاج بالاسم والعلامة التجارية. حيث تُعد هذه القاعدة واحدة من أكبر مجموعات 
البيانات من نوعها غير محددة الهوية على أرض الواقع والمتوافقة مع -HIPAA‏ 

ويمكن استخدام 814185 لتطوير تطبيقات تحليلية متعددة. وأحد هذه التطبيقات 
هو فهم العلاقات بين الأمراض على أساس المعلومات حول الأمراض المتزامنة (التي تأتي 
في وقت واحد) المتقدمة في المرضى. فعندما يصاب مريض واحد بعدة أمراضء OB‏ 
هذة 'الحالة تسمى اعتلال مشترك. .ومن الممكن أن تكون الأمراض المصاحبة مختلفة 
عبر المجموعات السكانية. وفي هذه الحالة العمليةء قامت مجموعة بحثية في جامعة 
أوكلاهوما الحكومية بعمل مقارنة بين الأمراض المصاحبة في المرضى من المناطق الحضرية 
والأمراض المصاحبة في المرضى من المناطق الريفية. 

وللمقارنة بين الأمراض المصاحبةء فقد تم تطبيق نهج تحليل الشبكة. وتتألف 
الشبكة من مجموعة محددة من العناصر تسمى العَقد. وترتبط هذه العقد ببعضها 
البعض من خلال الحواف؛ حيث تمثل الحافة علاقة محددة بين العقد. ومن أكثر الأمثلة 
شيوعًا على الشبكة؛ مثال شبكة صداقة يتواصل فيها الأفراد مع بعضهم البعض في حالة 
ما إذا كانوا أصدقاء. وعلى نحو مماثل» فهناك شبكات أخرى مشتركة مثل شبكات 
الحاسب» وشبكات صفحات الويبء بالإضافة إلى شبكات الطرقء وشبكات المطارات. 
ولمقارنة الأمراض المصاحبة» فقد تم تطوير الشبكات الخاصة بالأمراض في المرضى من 
ا مستشفيات الريفية والحضرية. وقد استُخدمت المعلومات المتعلقة بالأمراض والتي 
طورها كل مريض خلال زيارات اللمستش فى لإنشاء شبكة للمرض. وقد بلغ إجمالي 
عدد زائري المستشفيات في ا مستشفيات الحضرية 51 مليون» في حين بلغ إجمالي عدد 
الزائرين في المستشفيات الريفية ١‏ مليون شخص. ولإدارة مثل هذه المجموعة الضخمة 
من البيانات. تم استخدام منصة البيانات الضخمة 45165 Causal LS Teradata‏ 
أطر e ul ads Lj] Aster äh las dssealls SQL-GRs -SQL-MRs .SQL‏ 
Ss CDS zJ! 822 Gephis .Aster AppCenter‏ 

ويعرض الشكل )١١-1(‏ شبكات الإصابة المرضية المشتركة الريفية والحضرية. حيث 
تمثل العقد في هذه الشبكات: الأمراض المختلفة المصنفة بحسب التصنيف الدولي 
للأمراض. المراجعة is al‏ التعديل السريري (ICD-9 CM)‏ مجمعة على rua‏ 
ثلاثة أرقام» حيث يتم الربط بين اثنين من الأمراض ف حالة ما إذا كانا مرتبطين بشكل 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Us‏ 


الفصل السابع 


vw 


كبير أو بشكل مرضي (0.01 > «). وكلما زاد حجم العقدة. دل ذلك على زيادة الإصابة 
بالمرض. الجدير بالذكر أن كثافة شبكات الإصابة المرضية الحضرية أكثر من كثافة 
الشبكة الريفية؛ حيث يبلغ عدد العقد والحواف ق الشبكة الحضرية YY Yg ۱,۰٤۳‏ 
على التواليء في حين أن عدد العقد والحواف في الشبكة الريفية يبلغ 197 و٣۷٠,۲‏ 
على التواليء مما يدل على أن تشخيص المرضى في المستشفيات الريفية غاليًا ما يشير 
إلى وجود عدد أقل من الأمراض المتزامنة. وتعرض التصويرات فرقًا واضحًا بين مط 
الأمراض المتقدمة في المناطق الحضرية والريفيةء مما يستدعي العديد من الأسئلة 
المتعلقة بالسياسات الطبية والاجتماعية والتي تتطلب المزيد من البحث والتحليل. 
وعلى الجانب الآخرء فقد قمنا بتضمين هذا التحليل لزيادة الوعي أيضًّا بقضية أخرى. 
وقد لاحظنا مبكرًا أن مجموعة البيانات المستخدمة لهذا التحليل شملت حوالي 77 
مليون لقاء مع المرضى ف المناطق الحضرية و١‏ مليون لقاء فقط مع المرضى في المناطق 
الريفية. وعلى الأرجح فإن هذا الاختلاف الكبير يرجع لعدم قدرة معظم ال مستشفيات 
الريفية على تحمل تكاليف نظام السجلات الطبية الإلكترونية الكبرى مثل Cerner‏ 
وبالتالي فإن البيانات تميل نحو ا مستشفيات الحضرية: غير أن أي أفكار نتجت عن هذه 
العينة سوف يتم التشكيك فيها. وكما ذكرنا في الفصل الرابع» فإنه رها تم سحب عينة 
متناسبة من المناطق الحضرية وتمت مقارنتها بسجلات المرضى الريفيين. 
|| تت الأمراض المعدية والطفيلية 
eos! ga‏ 
رح أمراض الغدد الصماء والتغذية 

والتمثيل الغذائي واضرابات المناعة 
2 أمراض الدم واعضاء تشكيل الدم 
2 الإضطرابات العقلية 
س أمراض الجهاز العصبي 
BENI‏ امراض اعضاء الحواس 
اس Sie ili ial al‏ 
mm‏ أمراض الجهار الهش 
هس أمراض الجهاز البولي التناسلي 
5 مضاعفات الحمل والولادة والنفاسة 
و الأمراض الجلدية وانسجة ما تحت 
آمراض الجهاز a‏ الهيكلي و 

ل جو تع 
m‏ طروت خاس ثرة الولادة 
am‏ أعراض وعلاقات وظروف 
غير محددة 
سس الإصابات والتسمم 
سط الأسباب الخارجية للإصابة 
والتصنيف الإضافي 














شكل :1١-۷‏ شبكات الأمراض المشتركة بين الحضر والريف 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 

















مفاهيم وأدوات البيانات الضخمة 


وستتحمل نظم قواعد البيانات التقليدية جهدًا في تجهيزها بكفاءة للبيانات 
الضخمة. وقد قام Teradata Aster‏ بتحليل البيانات التي تحتوي على معلومات 
عن 15 مليون زيارة و١٠٠٠‏ مليون سجل سريع وسهل إلى حد ما. وغالبًا ما يتم 
اقتراح تحليل الشبكة على اعتبار أنه طريقة واحدة لتحليل مجموعات البيانات 
الضخمة؛ فهو يساعد على فهم البيانات في صورة واحدة. في هذه الحالة العملية, 
تبين شبكة الإصابة المرضية المشتركة العلاقة بين الأمراض في مكان واحد. 


أسئلة للمناقشة: 

-١‏ للماذا يمكن أن تكون الإصابة المشتركة للأمراض مختلفة بين المستشفيات في 
الريف وفي الحضر؟ 

-١‏ ما هي مسألة الفرق الكبير بين مواجهات المرضى في كل من المناطق الريفية 
والحضرية؟ 


- ما هي المكونات الرئيسة للشبكة؟ 
-٤‏ أين أيضًا يمكنك تطبيق نهج الشبكة؟ 
Source: Kalgotra, P., & Sharda, R. (2016). Rural versus urban comorbidity networks.‏ 
Working Paper, Center for Health Systems and Innovation, Oklahoma State University.‏ 
كما يزداد الدور الذي تلعبه السحابة في سوق البيانات الضخمة. ويقوم كل من 47078202 و600816© 
بدعم عمليات نشر هادوب في عروض السحابة العامة. أما Googles Amazon Elastic MapReduce‏ 
lgl dle Compute Engine‏ فإنهما يقومان بتمكين المستخدمين من توسيع النطاق وتقليل حجم 
ا مجموعات بسهولة حسب الحاجة. وتقوم مايكروسوفت (1/170501) بدعم توزيع هادوب الخاص 
بهورتنورك في سحابة 421056. وفي الفصل التالي سوف نناقش العروض القائمة على السحابة. 
كما ينتهج أيضًا موردون آخرون نهج البيانات الضخمة من زاوية التحليلات المرئية. وكما يشير 
Magic Quadrant‏ أحدث إصدارات 2562© فإن هناك نموًا à DS‏ ذكاء الأعمال والتحليلات 
في الاستكشافات والتحليلات المرئية. وتقوم الشركات الكبيرة مثل 545: و542: و1821 بجانب 
شركات صغيرة غير أنها مستقرة مثل ناه1ط]1, QlikViews TIBCO s‏ بتقديم حالة قوية 
لتحليلات الأداء العالي الموجودة في منصات تصوير المعلومات. وتقدم رؤية فنية (1-) عددًا 
قليلًا من العوامل المساعدة الرئيسة لتحقيق النجاح مع البيانات الضخمة والتحليلات المرئية. 
وربما يكون 545 هو الدافع لها بقوة أكثر من أي شيء آخر مع منصته التي ظهرت مؤخرًا وهي 
5 للتحليلات المرئية» وقد سبق تقدهه ق الفصل الثاني. وباستخدام العديد من التحسينات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vw‏ 


الفصل السابع 


الحسابية يستطيع برنامج التحليلات المرئية 545 تحويل عشرات الملايين من سجلات البيانات إلى 
رسومات بيانية معلوماتية خلال بضع ثوان فقط باس تخدام المعالجة المتوازية الواسعة (3/]55) 
والحوسبة داخل الذاكرة. 


رؤية فنية 1-١‏ 
كيف تنجح مع البيانات الضخمة 
من البيت الأبيض وحتى منزلك يصعب العثور على منظمة أو شخص لديه اليوم بيانات 
أقل من عام مضى» حيث تتزايد خيارات قاعدة البيانات» كما يتطور ذكاء الأعمال نحو عهد 
جديد من التحليلات على مستوى المنظمة» بالإضافة إلى أن كل شيء يتحرك ولا يبقى واققًا 
في مكانه. فالمنظمات التي استطاعت تكييف هيكل البيانات الخاص بها وعملياتها بنجاح 
من أجل معالجة الخصائص الثلاثة للبيانات الضخمة - الحجم» والتنوع» والسرعة - تعمل 

على تحسين الكفاءة التشغيلية» وتزايد الإيرادات؛ بالإضافة إلى تمكين نماذج أعمال جديدة. 

والحقيقة أن معدل التغيير سوف يتحقق فقط مع كل المنظمات التي تهتم بوضعها الذي 

يتعلق بالابتكار في كل ما يخص البيانات. إِذَا ما الذي يجب على الشركات فعله حتى 

تحقق النجاح مع البيانات الضخمة؟ وفيما يلي بعض من التوصيات الصناعية: 

-١‏ التبسيط: إنه لمن الصعب أن تتم متابعة جميع موردي قواعد البيانات الجدد: 
وجميع المشاريع ا مجانيةء وجميع مقدمي خدمات البيانات الضخمةء بالإضافة إلى 
أن كل هذه الأشياء سوف تزداد ازدحامًا وتعقيدًا في الأعوام المقبلة. ومن ثم» فهناك 
حاجة ماسة للتبسيط. فمن الضروري اتباع نهج إستراتيجي من خلال توسيع نطاق 
أنظمة معالجة المعاملات العلائقية والاتصال عبر الإنترنت الخاصة بك إلى واحد أو 
أكثر من البرامج الجديدة المُستضّافة داخل المؤسسة» أو خيارات قاعدة البيانات 
القائممة على الخدمة والتي تعكس احتياجات صناعتك ومنظمتك على أكمل وجه: 
ومن ثم اختيار منصة ذكاء الأعمال الذي يدعم الاتصالات المباشرة للعديد من قواعد 
البيانات وتنسيقات الملفات في الوقت المناسب. ومن الجدير بالذكر أن اختيار 
أفضل مزيج من بدائل الحلول لكل مشروع (ما بين الاتصال المباشر بقواعد البيانات 
السريعة وتلقي مستخرجات البيانات في داخل محرك التحليلات في الذاكرة لتعويض 
أداء قواعد البيانات البطيئة أو المثقلة بالأعباء) هو أمر بالخ الأهمية لنجاح أي 
مشاريع بيانات ضخمة. فعلى سبيل المثال: تتألف بنية تحليلات البيانات الضخمة 
من تيراداتا (وهي إحدى أشهر شركات مستودعات البيانات)» وهادوب (وهو الحل 


ve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


الأكثر نجاحًا لتحدي البيانات الضخمة)؛ بالإضافة Tableau J}‏ (وهو أحد موردي 
حلول التحليلات البصرية غزيرة الإنتاج). ويمكن مموظفي yه8ء‏ تصوير الأفكار من 
أكثر من 01 بيتابايتس من البيانات. ويستخدم Odal J> eBay‏ المرئية بواسطة 
101 لتحليل مدى ملاءمة البحث وجودة موقع eBay‏ الذي يقوم بمراقبة أحدث 
ملاحظات العملاء وقياس ميولهم» بالإضافة إلى تحقيق التقارير التشغيلية لأنظمة 
مستودعات البيانات» وقد ساعد كل ذلك على نجاح الثقافة التحليلية داخل yة8ع.‏ 

۲- التعايش: إن استخدام نقاط القوة لكل منصة قاعدة بيانات» وتمكينها من التعايش 
في بنية بيانات مؤسستك لهو أمر ضروري. وهناك العديد من الكتابات التي تحدثت 
عن ضرورة الحفاظ على التعايش بين مستودعات البيانات التقليدية وقدرات 
المنصات الجديدة وتعهده بالرعاية. 

g Forrester Sà التصوير: بالنسبة للشركات الرائدة في أبحاث التحليلات مثل‎ -٠" 
فإن المؤسسات تتحرى أن يكون لديها منصات متقدمة لتصوير البيانات‎ Gartner 
«bU من أجل أن تكون أدوات أساسية ممَكّنهم من مراقبة الأعمالء والعثور على‎ 
واتخاذ إجراءات لتجنب التهديدات واقتناص الفرص. وتساعد التحليلات البصرية‎ 
oM المنظمات في الكشف عن الاتجاهاتء والعلاقات: والعيوب عن طريق التحول‎ 
من خلال كميات كبيرة جدًا من البيانات. ولتجربة التحليل ا مرئي خصائص معينة؛‎ 
فهي تيح لك القيام بشيئين في أي لحظة» وهما:‎ 
تغيير البيانات التي تبحث عنها بشكل فوري. وتكمن أهمية هذا الأمر في كون‎ - 

الأسئلة المختلفة تتطلب بيانات مختلفة. 
- تغيير الطريقة التي تنظر بها إلى البيانات بشكل فوري. ويُعد ذلك مهما لأن كل 
عرض قد يجيب عن أسئلة مختلفة. 

وهذ المزيج يُحدث التجربة الاستطلاعية المطلوبة لأي شخص للإجابة على الأسئلة 
بسرعة. وهذه التجربة في جوهرها تؤدي إلى أن يصبح التصوير البصري امتدادًا 
طبيعيًا لعملية التفكير التجريبي. 

ع- التمكين: تسير البيانات الضخمة جنبًا إلى جنب مع خدمة ذكاء الأعمال الذاتية, 
ووفقًا لمجموعة 4060668 التي دشرت مؤخرّاء فإن «قيمة التحليلات والبيانات 
الضخمة تزداد إلى أقصى حد». ومن الجدير بالذكر أن المنظمات التي لديها بيانات 
ضخمة تمتلك فرصة تفوق نسبة +/1* في احتمالية أن يكون لديها مشاريع /81 
84 أكثر من المنظمات الأخرى والتي يتم توجيهها من قبل مجتمع الأعمال: وليس 

ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 110 


الفصل السابع 


من قبل مجموعة تقنية ا لمعلومات. وعبر مجموعة من الاستخدامات من معالجة 
مشاكل الأعمال الجديدة. وتطوير منتجات وخدمات جديدة بالكاملء والعثور على 
الذكاء القابل للتطبيق ف أقل من ساعةء ومزج البيانات من مصادر متباينة تجعل 
البيانات الضخمة تطلق العنان لما هو ممكن من خلال تطبيق التحليلات. 

0- التكامل: يُعد تكامل ومزج البيانات من مصادر مختلفة جزءًا أساسيًا من تحليلات 
البيانات الضخمة لمنظمتك. فال منظمات التي يمكنها مزج مصادر بيانات Asl‏ 
علائقية مختلفة. وشبه مهيكلة, في الوقت المناسبء وبدون تكاليف دمج أولية 
باهظة الثمن» هي المنظمات ذات أفضل قيمة من البيانات الضخمة. وبمجرد حدوث 
الدمج والمزجء فإن هيكل البيانات (مثل: جداول البياناتء أو قاعدة البيانات» أو 
مستودع البيانات» أو نظام ملفات مجاني مثل هادوب» أو جميعها في نفس الوقت) 
يصبح غير مهم؛ وهذا يعني أنك لست بحاجة إلى معرفة تفاصيل كيفية مستودعات 
البيانات لطرح الأسئلة والإجابة عليها. وكما رأينا في حالة عملية »)٤-۷(‏ أن حملة 
أوباما وجدت طريقة لدمج وسائل التواصل الاجتماعي» والتقنيةء وقواعد بيانات 
البريد الإلكتروني» وجمع البيانات» وبيانات السوق الاستهلاكية لعمل ميزة تنافسية. 

1- الحوكمة: لطاما كانت حوكمة البيانات مشكلة صعبة في مجال تقنية المعلومات» 
ومع ظهور البيانات الضخمة أصبح الأمر أكثر حيرة. وهناك أكثر من 6١‏ دولة لديها 
قوانين لخصوصية البيانات. وقد حدد الاتحاد الأوروبي سبعة «مبادئ خصوصية للملاذ 
الآمن» لحماية بيانات مواطنيهم الشخصية. ففي سنغافورة بدأ تفعيل قانون حماية 
البيانات الشخصية في يناير .7١11'‏ وفي الولايات المتحدة الأمريكية, يؤثر Sarbanes-‏ 
e Oxley‏ جميع الشركات المدرجة في البورصة» ويضع قانون 111044 (قانون نقل 
التأمين الصحي وامُساءلة وقابلية النقل) المعايير الوطنية في مجال الرعاية الصحية. 
ويختلف التوازن الصحيح بين التحكم والتجريب تبعًا لاختلاف التنظيم والصناعة. 
ويبدو أن أفضل ممارسات إدارة البيانات الرئيسة تساعد في إدارة عملية الحوكمة. 

۷ التبشير: فمن خلال الحصول عاى دعم من واحد أو أكثر من الرعاة التنفيذيينء 
يستطيع المُبشرون مثلك الحصول على الكرة المتداولة وغرس مجموعة فاضلة: فكلما 
زاد عدد الإدارات في منظمتك والتي تحقق فوائد قابلة للتطبيق» تصبح التحليلات 
أكثر انتشارًا عبر منظمتك. وتُّعد التحليلات المرئية السريعة والسهلة في الاستخدام 
هي المفتاح الذي يفتح الباب أمام تبني التحليلات والتعاون على نطاق المنظمة. 

Sources: Lampitt, A. (2012). Big data visualization: A Big deal for eBay. infoworld. 

com/d/Big-data/Big-data-visualization-Big- deal-ebay-208589 (accessed August 


Uu‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


2016). Tableau white paper. (2012). 7 Tips to Succeed with Big Data in 2013. 
cdnlarge.tableausoftware.com/sites/default/files/whitepapers/7-tips-to-succeed- 


with-Big-data-in-2013.pdf (accessed August 2016). 


أسئلة للمراجعة على القسم -V‏ 

-١‏ ما المقصود بمشهد موردي البيانات الضخمة؟ ومن هم اللاعبون الكبار؟ 

"- في رأيك كيف سيتغير مشهد موردي البيانات الضخمة في المستقبل القريب؟ وماذا؟ 
-Y‏ ما دور التحليلات المرئية في عاط البيانات الضخمة؟ 


۷-۷ البيانات الضخمة وتحليلات التيار: 


تعد السرعة من أهم الخصائص الرئيسة التي تميز البيانات الضخمة إلى جانب خاصيتي الحجم 
والتنوع» GUI‏ رأيناهما سابقًا في هذا الفصل» وتشر السرعة هنا إلى السرعة التي يتم بها إنشاء 
البيانات وتدفقها إلى بيئة التحليلات. وتبحث ال منظمات عن وسائل جديدة معالجة تيار البيانات 
عندما تأقي للاستجابة بسرعة وبدقة على المشاكل والفرص من أجل إرضاء عملائهم والحصول على 
ميزة تنافسية. وفي الحالات التي gb‏ فيها تيارات البيانات بشكل سريع وبصورة مستمرة, فإنه 
غالبًا ما تصل طرق التحليل التقليدية التي تعمل مع البيانات المتراكمة سابقًا (أي البيانات في حالة 
الراحة) إلى قرارات خاطئة بسبب استخدام الكثير من البيانات خارج السياق» أو تصل هذه الطرق 
إلى القرارات الصحيحةء ولكن بعد فوات الوقت الذي تحتاج المنظمة إلى استخدامها فيه. لذلك؛ 
فإنه من المهم في العديد من مواقف العمل أن يتم تحليل البيانات بعد وقت قصير من إنشائها 
و / أو بمجرد أن يتم بثها في نظام التحليلات. 

ومن المفترض أن أغلب الأعمال في العصر الحديث تعيش حاليًا على مبدأ أنه من المهم 
والضروري تسجيل كل جزء من البيانات؛ لأنه ربما يحتوي على معلومات قيمة قد يحتاج إليها 
العمل الآن أو في وقت ما في المستقبل القريب. وكيفما يزداد عدد مصادر البيانات» فإن نهج 
«تخزين كل شيء» يصبح أصعب وأصعبء بل إنه قد يكون غير ممكن في بعض الحالات. ds‏ 
الواقع» فإنه على الرغم من التقدم التقنيء إلا أن سعة التخزين الإجمالية الحالية تختلف DS‏ 
عن المعلومات الرقمية التي يتم إنتاجها في العالم. وعلاوةَ على ذلك فإن الكشف المستمر عن 
التغييرات ذات الدلالة في البيانات بالإضافة إلى الاختلافات المعقدة للأنماط ضمن نافذة زمنية 
قصيرة معينة في الوقت المناسب في بيئة الأعمال المتغيرة» يُعد أمرًا ضروريًا للتوصل إلى الإجراءات 
التي تتلاءم بشكل أفضل مع البيئة الجديدة. ومما سبق يتبين أن كل هذه الحقائق التي ذكرت 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vw‏ 


الفصل السابع 


تُعد هي المحفز الرئيس لظهور نموذج يُُسمى بتحليلات التيار. وقد ظهر نموذج تحليلات التيار 
كاستجابة لكل هذه التحديات» وبالتحديد التدفقات غير المحدودة من البيانات التي لا هكن 
تخزينها بشكل دائم ليتم تحليلها لاحقًاء ق الوقت المناسب وبكفاءة: بالإضافة إلى تحدي التغيرات 
النمطية المعقدة التي تحتاج إلى الكشف عنها والتصرف فور حدوثها. 

ويُستخدم مصطلح تحليلات التيار (ويسمى أيضًا تحليلات البيانات في الحركة والتحليلات 
الفورية للبيانات) عادةً من أجل العملية التحليلية الخاصة باستخراج معلومات قابلة للتطبيق 
من بيانات التيار / البيانات المتدفقة بشكل متواصل. ويُعرف التيار بأنه تسلسل مستمر لعناصر 
(Y « W «55, 2s Zikopoulos) LUI‏ وغالبًا ما تُسمى عناصر البيانات في مجموعة ما 
pieg tuples gial‏ قاعدة البيانات العلائقية. حيث يشبه ءامنا صفًا من البيانات (سجلء 
موضوع. مثال). ومع ذلك فإنه في سياق البيانات شبه المهيكلة أو غير المهيكلة» ga tuple o‏ 
عبارة عن تجريد Jie‏ حزمة من البيانات» والتي يمكن وصفها lib‏ مجموعة من السمات للموضوع 
معين. فإذا كان اتنا بحد ذاته غير واف بالمعلومات الكافية للتحليل أو الارتباط أو العلاقات 
الجماعية الأخرى بين الصفوف المطلوبة» فعندئذ يتم استخدام نافذة للبيانات تتضمن مجموعة 
من الصفوف 165م0]. هذه النافذة من البيانات عبارة عن عدد / تتابع محدود من الصفوف 
tuples‏ حيث يتم تحديث النوافذ باستمرار كلما توافرت بيانات جديدة. ويتم تحديد حجم 
النافذة بناءً على النظام الجاري تحليله. وقد أصبح انتشار تحليلات التيار متزايدًا لسببين. أولهماء 
أن قيمة وقت العمل أصبحت في تناقص مستمرء وأما ثانيهماء أننا لدينا الوسائل التقنية لالتقاط 
ومعالجة البيانات أثناء إنشائها. 

وقد تم تطوير بعض التطبيقات التي تعد أكثر تطبيقات تحليلات التيار تأثيرًا في صناعة الطاقة, 
وتحديدًا من أجل أنظمة الشبكات الذكية (سلسلة إمدادات الطاقة الكهربائية). فالشبكات 
الذكية الجديدة لا يمكنها فقط إنشاء ومعالجة تيارات متعددة للبيانات في الوقت المناسب من 
أجل التوزيع الأمثل للطاقة لمقابلة احتياجات العملاء الحقيقية: بل إنها أيضًا يمكنها إنشاء تنبؤات 
دقيقة على امدى القصير تهدف إلى تغطية الحاجات الخُلحة غير المتوقعة وتوليد الطاقة المتجددة. 
ويوضح الشكل (-17) صورة حالة استخدام عامة لتحليلات التيار في صناعة الطاقة (تطبيق 
الشبكة الذكية النموذجي)» والغرض من ذلك هو التنبؤ بدقة بالطلب على الكهرباء وإنتاجها 
في الوقت المناسب باستخدام بيانات التيار التي توفرها العدادات الذكية وأجهزة استشعار نظام 
الإنتاج ونماذج الرصد. ويمكن استخدام كل من القدرة على التنبؤ باتجاهات الاستهلاك / الإنتاج 
في المستقبل القريب بالإضافة إلى اكتشاف الحالات الشاذة في الوقت ال مناسب من أجل تحسين 


vM‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


قرارات التوريد (كمية الإنتاج: وموارد الإنتاج المستخدمة: وتعديل قدرات الإنتاج على النحو 
الأمثل) بالإضافة إلى ضبط العدادات الذكية لتنظيم الاستهلاك والتسعير الملائم للطاقة. 

















قرارات السعة نظام إنتاج الطاقة 
( تقليدى وقابل للتجديد) . | | 
| بيانات جهاز الإستشعار 
| (حالة نظام إنتاج الطاقة) 
| تكامل البياقات el‏ 
F---‏ ين |<------]) (الرياحالضوء؛ 
ال ححا 3 ..درجة الحرارة؛إلخ) 
| منطقة التخزين الداك بيانات الإستخدام 
د ع لود (المقابيس الذكية؟ 
MÀ |‏ أجهزة الشبكة الذكية) 
| قرارات التسعير نظام استهلاك الطاقة | 
(سكنى وتجاري) 























شكل 1۲-۷: حالة استخدام تحليلات التيار في صناعة الطاقة 


تحليلات التيار مقابل التحليلات الدائمة: 

قد يبدو لمعظم الناس أن كلا المصطلحين التيار والدائم هما الشيء نفسه. كما أنهما ييستخدمان في 
كثير من الحالات بشكل مترادفء غير أنه يوجد اختلاف بينهما في سياق الأنظمة الذكية (2007 ,85ه10). 
فتحليلات التيار تنطوي على تطبيق منطق مستوى المعاملات إلى المشاهدات الفورية؛ حيث إن 
القواعد المطبقة على هذه الملاحظات تأخذ في اعتبارها الملاحظات السابقة طالما أنها وقعت في 
النافذة المقررة؛ وتحتوي هذه النوافذ على حجم عشوائي (مثل: آخر ه ثوانء وآخر ٠١٠٠١‏ ملاحظة). 
وعلى الجانب الآخرء فإن التحليلات الدائمة تقوم بتقييم كل مشاهدة واردة في مقابل كل المشاهدات 
السابقة. حيث لا يوجد حجم نافذة. ومن الجدير بالذكر أن التعرف على كيفية ارتباط المشاهدة 
الجديدة بجميع المشاهدات السابقة تمَكّن من تكوين رؤية في الوقت المناسب. 

ولكل من تحليلات التيار والتحليلات الدائمة مزاياها وسلبياتها وأماكنها الخاصة في عالم تحليلات 
الأعمال. فعلى سبيل JU‏ أحيانًا تكون أحجام المعاملات كبيرة للغاية ويكون وقت اتخاذ القرار قصياً 
جدًا. مما يؤدي إلى تفضيل عدم الثبات وأحجام النوافذ الصغيرة» والتي I eos‏ تحليلات التيان في 
حين أنه عندما تكون المهمة خطيرة ويمكن إدارة وحدات التخزين في الوقت المناسبء فعندئذ تكون 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ta‏ 



































القصل السابع 


à LUE CAL dal‏ هى الخيار الأفضل. وبهذه الطريقةء فإنه يمكن الإجابة على أسئلة من نوع: «ما 
علاقة ما تعلمته للتو بما كنت أعرفه؟» «هل هذا شيء مهم؟»» «من الذي يحتاج إلى المعرفة؟». 


معالجة الأحداث الحرجة: 

إن معالجة الأحداث الحرجة هي طريقة التقاطء gig‏ وتحليل تيارات البيانات للكشف عن 
الأحداث (التي تكون خارج الأحداث العادية) لأنواع معينة تستحق الجهد ا مبذول. وتعد معالجة 
الأحداث ال معقدة تطبيقًا لتحليلات التيار والتي يتم فيها جمع البيانات من مصادر متعددة 
لاستنتاج الأحداث أو أنماط الاهتمام إما قبل حدوثها بالفعل أو بمجرد حدوثها. والهدف من ذلك 
هو اتخاذ إجراءات سريعة من أجل منع حدوث الآثار السلبية لهذه الأحداث أو التخفيف منها 
(مثل: الاحتيال أو اختراق الشبكات). أو في حالة وجود بصيص أمل من الفرصةء فيكون الهدف 
هو الاستفادة الكاملة من الموقف ف الوقت المسموح به (بناءً على سلوك المستخدم على موقع 
التجارة الإلكترونيةء وإنشاء عروض ترويجية والتي يُرجح أن يستجيب لها المُستخدم). 

وقد تقع هذه الأحداث الحرجة عبر طبقات مختلفة من المنظمة مثل العملاء ا محتملين أو 
الطلبات» أو مكالمات خدمة العملاء» أو على نطاق أوسع؛ والذي قد يكون عناصر إخبارية: أو رسائل 
نصيةء أو منشورات وسائل التواصل الاجتماعيء أو تغذيات سوق الأوراق امالية» أو تقارير حركة 
المرورء أو الأحوال الجوية» أو غيرها من أنواع الحالات الشاذة التي قد يكون لها تأثير كبير على 
تحسين خالة المنظمة. ‏ كماامكن آنا تعريقف الحدث يكل عام على آنه وتغيير الحالة»: الذي 38 
يتم اكتشافه على أنه قياس يتجاوز بداية محددة في وقت سابقء أو درجة الحرارة أو قيمة أخرى. 
وعلى الرغم من أنه لا يوجد إنكار لاقتراح القيمة الخاصة بمعالجة الأحداث الحرجة: إلا أنه يتعين 
انتقاء ما يجب قياسه» ومتى يتم القياس» وكم مرة يتم القياس. وبسبب الكم الهائل من المعلومات 
المتوفرة حول الأحداث: والتي يشار إليها أحيانًا بااسم سحابة الحدث: فإن هناك احتمال للمبالغة 
فيهاء وفي هذه الحالة فإنها قد تضر بالفعالية التشغيلية للمنظمةء بدلا من مساعدتها. 


التنقيب في تيار البيانات: 

يمكن تعريف التنقيب في تيار البيانات» باعتباره تقنية تمكينية لتحليلات التيارء على أنه عملية 
استخراج الأنماط الجديدة وهياكل المعرفة من سجلات البيانات السريعة والمتواصلة. وكما رأينا 
في فصل التنقيب في البيانات (الفصل الرابع)» فإن الطرق التقليدية للتنقيب في البيانات تتطلب 
جمع البيانات وتنظيمها في شكل ملف مناسب. ثم يتم معالجتها بطريقة متكررة لمعرفة الأنماط 
الأساسية. وعلى النقيض من ذلك فإن تيار البيانات هو تدفق مستمر لتسلسل مرتب من النماذج 


w‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


التي يمكن قراءتها / معالجتها في كثير من التطبيقات الخاصة بالتنقيب في تيار البيانات مرة واحدة 
فقط أو عدد قليل من المرات باستخدام قدرات محدودة للحوسبة والتخزين. وتشتمل أمثلة تيار 
البيانات على بيانات جهاز الاستشعارء وزيارات شبكة الحاسبء وال محادثات الهاتفية. ومعاملات 
-ATM‏ وبحث الويب. والبيانات المالية. ويعتبر التنقيب في تيار البيانات حقلًا فرعيًا من التنقيب 
في البيانات» وتعلم الآلة. واكتشاف المعرفة. Å‏ 

ويتمثل الهدف في العديد من تطبيقات التنقيب في تيار البيانات» في التنبؤ بالدرجة أو القيمة 
الغاضة بالف جاذج الجديذة ف تيا البياتات التي قوفر يعض dx doge doo d yn‏ أو ed‏ 
النماذج السابقة في تيار البيانات. ويمكن استخدام أساليب تعلم الآلة المتخصصة (ومعظمها 
مشتقة من أساليب تعلم الآلة التقليدية) لتعلم مهمة التنبؤ من الأمثلة المصنفة بطريقة آلية. 
وقد قام کل من iS] di o (de JUs lh (2005) Kims .Kletkes .Delen‏ حيث قاموا 
تدريجيًا ببناء وصقل نموذج لشجرة القرار باستخدام مجموعة فرعية من البيانات في وقت واحد. 
أسئلة للمراجعة على ۷-۷: 
-١‏ ما هو التيار (في عاط البيانات الضخمة)؟ 
-Y‏ ما هي الدوافع لتحليلات التيار؟ 
*- ما هي تحليلات التيار؟ وكيف تختلف عن التحليلات العادية؟ 
ع- ما هي معالجة الأحداث الحرجة؟ وكيف ترتبط بتحليلات التيار؟ 
-٥‏ عرّف التنقيب في تيار البيانات. ما هي التحديات الإضافية التي يطرحها التنقيب في تيار البيانات؟ 


۸-۷ تطبيقات تحليلات التيار: 

إن استخدام تحليلات التيار يتخذ اتجاهًا متزايدًا بشكل كبيرء وذلك نظرًا لقدرته على إحداث 
رؤية حالية» مما ساعد صانعي القرار على التواجد على قمة الأحداث عندما يتوسعونء الأمر 
الذي يتيح للمنظمات معالجة القضايا قبل أن تتحول إلى مشكلات. وفيما يلي بعض مجالات 
التطبيق التي استفادت بالفعل من تحليلات التيار. 
التجارة الإلكترونية: 

تحاول العديد من الشركات تحقيق أقصى استفادة من البيانات التي تجمعها أثناء وجود 
العميل على موقع الويب الخاص بهاء مثل شركة Amazon‏ وشركة إ83ء (من بين العديد من 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wi‏ 


الفصل السابع 


الشركات الأغرى). حيث يتم تسجيل وتحليل كل صفحة تتم زيارتهاء وكل منتج تمت مشاهدته. 
وكل عملية بحث أجريته بالإضافة إلى كل نقرة يتم عملهاء وذلك لزيادة القيمة المكتسبة من 
زيارة المستخدم. فإذا تم القيام بذلك بسرعة» فإن تحليل مثل هذا التيار من البيانات يمكنه 
تحويل المتصفحين إلى مشترين والمشترين إلى مدمني تسوق. فعندما نقوم بزيارة موقع للتجارة 
الإلكترونية على الويب» حتى وإن لم نكن أعضاءً فيه فإننا بعد عدة نقرات» نبدأ في الحصول 
على عروض أسعار منتجات وحزم مثيرة للاهتمام بشكل كبير. ويتم خلف الكواليس بشكل 
فوري إجراء التحليلات المتقدمة للبيانات الناتجة عن نقراتناء وآلاف النقرات من الآخرين» 
«لفهم» ما نحن مهتمون به (في بعض الحالات» حتى ولو م نكن نعرف ذلك) وتحقيق أقصى 
استفادة من هذه المعلومات من خلال تقديم عروض إبداعية. 
الاتصالات الهاتفية: 

إن حجم البيانات التي تأتي من سجلات تفاصيل المكاللمات (01018) لشركات الاتصالات: أمر 
مدهش. وعلى الرغم من أن هذه المعلومات قد استخدمت لأغراض إعداد الفواتير منذ فترة 
ليست بالقصيرة, إلا أن هناك ثروة من المعرفة المدفونة في عمق هذه البيانات الضخمة والتي 
تدركها شركات الاتصالات الآن. فعلى سبيل JULI‏ يمكن gib CDR lly Jelas‏ تحول العملاء 
إلى شركة أخرى عن طريق تحديد الشبكات الخاصة بالمتصلينء والمؤثرين. والقادة, والمتابعين 
داخل هذه الشبكات والعمل على هذه المعلومات بشكل استباقي. وكما نعلم جميعًاء فإن 
للقادة وللمستخدمين المؤثرين Bib‏ كبيرًا في تغيير نظرة المتابعين داخل شبكتهم نحو مقدم 
الخدمة. سواء بشكل إيجابي أو سلبي. وتقوم شركات الاتصالات بتحديد القادة وأصحاب النفوذ 
والمشاركين في شبكاتهم لإدارة قاعدة عملائهم بشكل أفضل وذلك باستخدام أساليب تحليل 
الشبكات الاجتماعية. كما يمكن بالإضافة إلى ذلك استخدام هذه المعلومات أيضًا لاستقطاب 
أعضاء جدد ورفع قيمة الأعضاء الحاليين إلى أقصى حد. 

ويمكن دمج التيارات المستمرة من البيانات التي تأتي CDR 9a‏ مع بيانات وسائل التواصل 
الاجتماعي (تحليل المشاعر) من أجل تقييم فعالية الحملات التسويقية. كما يمكن استخدام 
الأفكار المكتتسبة من هذه التيارات الخاصة بالبيانات للتفاعل السريع مع التأثيرات الضارة (التي 
قد تؤدي إلى فقدان العملاء) أو تعزيز وقع التأثيرات الإيجابية المشاهدة في هذه الحملات (والتي 
قد تؤدي إلى تعظيم عمليات الشراء للعملاء الحاليين واستقطاب de aleg (ou> das‏ 
ذلك» فإنه يمكن تكرار عملية اكتساب الأفكار من 011 من أجل شبكات البيانات التي تستخدم 
سجلات تفصيلية لبروتوكول الإنترنت. ونظرًا لقيام معظم شركات الاتصالات بتوفير كلا النوعين من 


VY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


هذه الخدمات: فإن التحسين الشامل لجميع العروض والحملات التسويقية قد يؤدي إلى مكاسب 
استثنائية في السوق. وتعد حالة عملية (۷-۷) مثالا على كيفية 43s) Salesforce.com ea3‏ 
بشكل أفضل من خلال الاعتماد على تحليل تيارات النقر. 


حالة عملية ۷-۷ 
استخدام 521651016 لتيار البيانات لتحسين قيمة العميل 

وسعت شركة 5316510166 خدمات السحابة التسويقية الخاصة بها لتشمل النتائج 
التنبؤية ومميزات الجمهور التنبؤية وتسمى بالتسويق السحالبي التنبؤي. وتستخدم هذه 
الإضافة بيانات التيار الفورية لتحسين تفاعل العملاء عبر الإنترنت. أولاه يحصل العملاء 
على درجة تنبؤية فريدة لهم» ويتم احتساب هذه النتيجة من عدة عوامل مختلفة, 
وتشمل كلا من طول مدة سجلٌ التصفح: وما إذا كانوا قد قاموا بالنقر على رابط البريد 
الإلكترونيء وما إذا كانوا قد قاموا بشراء ماديء وكم أنفقواء ومنذ متى قاموا بالشراء» وما 
إذا كانوا قد استجابوا لأي بريد إلكتروني أو حملة إعلانية. وبمجرد حصول العملاء على 
درجة» يتم تقسيمهم إلى مجموعات مختلفة؛ حيث يتم إعطاء هذه المجموعات خططًا 
وأهدافًا تسويقية مختلفة اعتمادًا على السلوكيات التنبؤية الخاصة بكل منهم؛ ويتم 
تحديث الدرجات والشرائح وتغييرها يوميًا مع إعطاء الشركات خارطة طريق أفضل 
لاستهداف وتحقيق الاستجابة المطلوبة. وتعد هذه الحلول التسويقية أكثر دقة كما أنها 
qus‏ طرقًا أكثر تخصيضًا للشركات والتي يمكنها استيعاب أساليب الاحتفاظ بالعملاء. 

أسئلة للمناقشة: 

-١‏ هل هناك مجالات في أي صناعة يكون فيها تيار البيانات غير ذي صلة؟ 

-Y‏ بخلاف الاحتفاظ بالعملاء» ما هي المزايا الأخرى لاستخدام التحليلات التنبؤية؟ 

ماذا نتعلم من هذه الحالة العملية؟ 

تستطيع الشركات من خلال تحليل البيانات التي تم الحصول عليها في المكان والزمان 
المناسبَينء أن تقوم بتنبؤات وتتخذ قرارات بشأن المستهلكين بسرعة أكبر. مما يضمن 
تحقيق أهداف الأعمالء وجذب العملاء ا مناسبين» والاحتفاظ بهم وتعظيم قيمتهم 
لأقصى حد. ومن الجدير بالذكر أن البيانات التي تم الحصول عليها في الأسبوع الماضي» 
ليست مفيدة مثل البيانات التي لدى الشركات اليوم. كما أن استخدام البيانات ذات 
الصلة يجعل تحليلنا التنبؤي أكثر دقة وكفاءة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري avy‏ 


الفصل السابع 


Sources: Amodio, M. (2015). Salesforce adds predictive analytics to Marketing Cloud. 
Cloud Contact Center  http://www.cloudcon-tactcenterzone.com/topics/cloud 
contact-center/articles/41361 1-salesforce-adds-predictive analytics-marketing- 
cloud.htm (accessed July 2016). Davis, J. (2015). Salesforce adds new predictive 
analytics to Marketing Cloud. Information Week. http://www.informationweek.com/ 
Big-data/Big-data analytics/salesforce-adds-new-predictive-analytics-to marketing- 
cloud/d/d-id/1323201 (accessed July 2016). Henschen, D. (2016). Salesforce reboots 
Wave Analytics, preps IoT cloud. ZD Net. http://www.zdnet.com/article/salesforce- 


reboots-wave-analytics-preps-iot-cloud/(accessed July 2016). 

تطبيق القانون والحماية الإلكترونية: 

توفر تيارات البيانات الضخمة فرصًا ممتازة لتحسين سبل منع الجريمة: وتطبيق القانونء 
وتعزيز الأمان. فهي توفر إمكانات مذهلة في مجال تطبيقات الأمن التي يمكن بناؤها في الفضاءء» 
مثل الوعي الظرفي الفوريء والمراقبة متعددة الوسائطء وكشف الأمان الإلكتروني» والتصنت على 
المكاط مات الهاتفيةء ومراقبة الفيديوء والتعرف على (Y WY «5552s Zikopoulos) 423Jl‏ 
مجال إنتاج الطاقة: 

تزداد كمية البيانات التي تم جمعها بشكل فوري عن طريق مرافق الطاقةء أضعافًا مضاعفة, 
بسبب زيادة استخدام العدادات الذكية. فقد انتقلت من مرة كل شهر لتصبح مرة كل ٠١‏ 
دقيقة (أو بشكل أكثر تكرارًا)» حيث تجمع قراءة العداد كميات كبيرة من البيانات القيمة لمرافق 
الطاقة. حيث ترسل هذه العدادات الذكية وغيرها من أجهزة الاستشعر ال موضوعة في جميع 
أنحاء الشبكة الكهربائيةء المعلومات إلى مراكز التحكم ليتم تحليلها فور وصولهاء حيث تساعد 
مثل هذه التحليلات شركات المرافق لتحسين قرارات سلاسل التوريد الخاصة بهم (مثل: تعديل 
السعة» وخيارات شبكة التوزيع» والشراء أو البيع الفوري) وذلك من خلال الاعتماد على أنماط 
الاستخدام والطلب للمستهلكين؛ بالإضافة إلى أن شركات المرافق يمكنها دمج بيانات الطقس 
والظروف الطبيعية الأخرى في تحليلاتها لتحسين توليد الطاقة من مصادر بديلة (مثل: الرياح» 
والطاقة الشمسية) وتوقع أدق لمقدار الطلب على الطاقة في عمليات الحبيبات الجغرافية 
المختلفة. كما أن هناك فوائد أخرى مشابهة تنطبق على المرافق الأخرى كاطياه والغاز الطبيعي. 
الخدمات المالية: 

تعد شركات الخدمات المالية من بين أبرز الأمثلة التي يمكن أن توفر تحليلات تيار البيانات 
الضخمة لها قرارات أسرع وأفضلء بالإضافة إلى الميزة التنافسية التي تقدمها لهاء وكذلك الرقابة 
we‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


التنظيمية. فهي توفر القدرة على تحليل البيانات السريعة ال متدفقةء والأحجام الضخمة من بيانات 
التداول عندما يكون وقت الاستجابة منخفض للغاية عبر الأسواق والدولء فضلًا عن تقدمها لميزة 
هائلة بشأن قرارات الشراء / البيع من النوع جزء من الثانية والتي يمكن أن تترجم إلى مكاسب مالية 
كبيرة. وبالإضافة إلى قرارات الشراء / البيع 9B «EL‏ تحليل البيانات يمكنه أيضًَا أن يساعد شركات 
الخدمات المالية في مراقبة التجارة بشكل فوري للكشف عن التزوير وغيره من الأنشطة غير القانونية. 
علوم الصحة: 

تستطيع الأجهزة الطبية حديثة العهد (مثل: أجهزة تخطيط القلب وا معدات التي تقيس 
ضغط الدم» ومستوى الأكسجين في الدم» ومستوى السكر في الدم» ودرجة حرارة الجسم) أن تنتج 
بيانات تشخيصية / حساسة ذات قيمة عالية معدل سريع للغاية؛ حيث إن تسخير هذه البيانات 
وتحليلها فور إنتاجها يقدم فوائد - من النوع الذي نطلق عليه غالبًا «مسألة حياة أو موت» - 
وذلك على عكس أي مجال آخرء فضلًا عن مساعدة شركات الرعاية الصحية لكي تصبح أكثر فعالية 
وكفاءة (مما يترتب عليه أن تصبح هذه الشركات أكثر تنافسية وقادرة على تحقيق أرباح عالية)» 
وتعمل تحليلات التيار أيضًا على تحسين ظروف المرضى وإنقاذ الأرواح. 

تقوم العديد من أنظمة المستشفيات في جميع أنحاء العام بتطوير البنية التحتية للرعاية 
وأنظمة صحية مستقبلية. وتهدف هذه الأنظمة إلى الاستفادة بشكل كامل مما تقدمه التقنيةء 
بل وأكثر من ذلك. إن استخدام الأجهزة التي تولد بيانات عالية الدقة معدل سريع للغايةء إلى 
جانب أجهزة الحاسب فائقة السرعة التى يمكنها تحليل تيارات البيانات المتعددة بشكل متوازن» 
يؤدي إل ؤياذة فض الحفاظ £i e‏ المرضى من خلال سرعة اكتشاف الحالات الشاذة. 
وتهدف هذه الأنظمة إلى مساعدة صانعي القرارات الخاصة بالبشر على اتخاذ قرارات أسرع 
وأفضل من خلال الاطلاع على عدد كبير من المعلومات بمجرد توفرها. 


الحكومة: 

تسعى الحكومات في جميع أنحاء العالم إلى إيجاد طرق ترفع من فعاليتها (من خلال الاستخدام 
الأمثل للموارد المحدودة) وأكثر فاعلية (بتوفير الخدمات التي يحتاجها الناس ويريدونها). ومع 
تحول ممارسات الحكومة الإلكترونية إلى الاتجاه السائد. إلى جانب الاستخدام واسع النطاق لوسائل 
التواصل الاجتماعي والوصول إليهاء فإن ذلك يوفر كميات ضخمة من البيانات (المهيكلة وغير 
المهيكلة) لتصبح تحت تصرف الجهات الحكومية. فالاستخدام السليم لتيارات البيانات الضخمة 
في الوقت المناسب هو الذي بميز الجهات الاستباقية ذات الكفاءة العالية عن غيرها من الجهات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wo‏ 


القصل السابع 


التي مازالت تستخدم الطرق التقليدية للتفاعل مع المواقف عند حدوثها. كما أن هناك طريقة 
أخرى تستطيع الجهات الحكومية من خلالها الاستفادة من قدرات التحليلات الفورية وهي إدارة 
الكوارث الطبيعية مثل العواصف الثلجية؛ والأعاصيرء والرياح الشديدةء وحرائق الغابات من خلال 
مراقبة تيار البيانات الصادر من أجهزة الرادارء وأجهزة الاستشعارء وأجهزة الكشف الذكية الأخرى. 
كما يمكنهم أيضًا استخدام أساليب مشابهة لرصد جودة المياهء وجودة الهواء» وأتماط الاستهلاك 
واكتشاف أي حالات مختلفة عن المعتاد قبل أن تصبح مشاكل كبيرة. وبالإضافة إلى ما سبق» فإن 
هناك مجالًا آخر تستخدم فيه الجهات الحكومية تحليلات التيار وهو مجال المرورء حيث تستخدم 
هذه التحليلات في إدارة حركة المرور في المدن المزدحمة؛ حيث يمكن للجهات الحكومية أن تغير 
إشارات المرور الضوئية وحارات المرور لتخفيف الإزعاج الذي تسببه مشاكل الازدحام ا مروري» 
وذلك باستخدام البيانات الصادرة عن كاميرات تدفق حركة ال مرورء وبيانات ال G۲8‏ التي تصدر 
عن المركبات التجاريةء وأجهزة استشعار حركة ال مرور الموجودة في الطرق. 


أسئلة للمراجعة على القسم A-V‏ 

-١‏ ما هي أكثر الصناعات فائدة لتحليلات التيار؟ 

۲- كيف يمكن استخدام تحليلات التيار في التجارة الإلكترونية؟ 

- بالإضافة إلى ما ذكر في هذا القسم» هل كنك التفكير في صناعات و / أو مجالات تطبيق أخرى 
يمكن استخدام تحليلات التيار فيها؟ 

-٤‏ با مقارنة مع التحليلات العادية» هل تعتقد أن تحليلات التيار ستحتوي على حالات استخدام 
أكثر (أو أقل) في عصر تحليلات البيانات الضخمة؟ وماذا؟ 


تلخيص لأهم نقاط الفصل: 

- للبيانات الضخمة معان مختلفة بالنسبة للأشخاص ذوي الخلفيات والاهتمامات المختلفة. 

- تتخطى البيانات الضخمة نطاق بيئة الأجهزة المستخدمة و / أو إمكانيات أدوات البرامج 
المستخدمة في جمعها وإدارتها ومعالجتها خلال فترة زمنية مقبولة. 

-عادة ما يتم تعريف البيانات الضخمة من خلال ثلاث 17: الحجم 011126 variety e 9:Jl‏ 


velocity ås plg 
يعتبر ع16410م118 أسلوبًا لتقسيم المعالجة لملفات البيانات الضخمة متعددة الهيكلة عبر‎ - 
تجمع كبير من الآلات.‎ 


wi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


- يعتبر هادوب إطار عمل مجاني لمعالجة وتخزين وتحليل كميات كبيرة من البيانات المقسمة غير المهيكلة. 

- يعتبر ©1117 تخزين بيانات مبني على هادوب - يشبه إطار عمل تم Facebook åhulg Ñj opgh5‏ 

- يعتبر 218 لغة استعلام مبنية على هادوب تم تطويرها بواسطة همطهلا. 

- تعتبر .1210501 والتي ترمز ل.آ59 تإ1له0 2106, نموذجًا جديدًا لتخزين ومعالجة كميات 
ضخمة من البيانات غير المهيكلة وشبه المهيكلة ومتعددة الهيكلة. 

- يعتبر عام البيانات 626156 ك5 1088 دورًا جديدًا أو وظيفةً جديدة ترتبط عادةً بالبيانات 
الضخمة أو علم البيانات. 

- تعتبر كلّ من البيانات الضخمة ومستودعات البيانات تقنيات متكاملة (وليست متنافسة) للتحليلات. 

- كمجال جديد نسبيّاه يتطور مورد البيانات الضخمة بشكل سريع جدًا. 

- تعتبر تحليلات التيار 5ع3:81(:1 512 مصطاحًا يُستخدم عادةً لاستخراج المعلومات القابلة 
للتطبيق من مصادر البيانات المتدفقة باستمرار. 

- تعمل التحليلات الدائمة على تقييم كل مشاهدة داخلة في مقابل جميع المشاهدات السابقة. 

- تعتبر معالجة الأحداث الحرجة طريقة لالتقاط وتتبع وتحليل تيارات البيانات لاستكشاف 
أحداث معينة (بخلاف الأحداث العادية) والتي تستحق هذا المجهود. 

- يعرف التنقيب في تيار البيانات» كتقنية تمكينية لتحليلات التيارء على أنه عملية لاستخراج 
الأنماط الجديدة وهياكل المعرفة من سجلات البيانات المستمرة والسريعة. 


مصطلحات أساسية: 

البيانات الضخمة. التنقيب في تيار البيانات. .Hive‏ 
تحليلات البيانات الضخمة. -MapReduce .Hadoop‏ 
معالجة الأحداث الحرجة. ملف هادوب المقسم. NoSQL‏ 
(HDFS) età‏ التحليلات الدائمة. Pig‏ 

تحليلات التيار. علماء البيانات. 














ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري aw‏ 




















القصل السابع 


أسئلة للمناقشة: 

-١‏ ما هي البيانات الضخمة؟ وطاذا تعتبر مهمّة؟ ومن أين تأقي؟ 

۲- في رأيك» ما هو مستقبل البيانات الضخمة؟ وهل ستفقد شعبيتها إلى شيءٍ آخر؟ إذا كانت 
الإجابة بنعم» فماذا سيكون ذلك الشيء؟ 

-Y‏ ما هي تحليلات البيانات الضخمة؟ وكيف تختلف عن التحليلات العادية؟ 

ع- ما هي العوامل ال مهمة لنجاح تحليلات البيانات الضخمة؟ 

-٥‏ ما هي التحديات الكبيرة التي يجب مراعاتها عند اعتماد تنفيذ تحليلات البيانات الضخمة؟ 

-٦‏ ما هي مشاكل الأعمال الشائعة التي تعالجها تحليلات البيانات الضخمة؟ 

۷- في عصر البيانات الضخمةء هل نعتبر بصدد نهاية عصر مستودعات البيانات؟ وماذا؟ 

۸- ما هي حالات استخدام البيانات الضخمة / هادوب ومستودعات البيانات / 98S‏ R؟‏ 

٩‏ ما هي تحليلات التيار؟ وكيف تختلف عن التحليلات العادية؟ 

-٠١‏ ما هي أكثر الصناعات المجدية لتحليلات التيار؟ وما هو القاسم المشترك بين تلك الصناعات؟ 

-١‏ بالمقارنة مع التحليلات العادية» هل تعتقد أن تحليلات التيار ستحتوي على حالات استخدام 

أكثر (أو أقل) في عصر تحليلات البيانات الضخمة؟ وطاذا؟ 


تمارين - شبكة جامعة تيراداتا (1[17) وغيرها من التمارين البدوية: 

-١‏ اذهب إلى »teradatauniversitynetwork.com‏ وابحث عن دراسات الحالة. قم بقراءة 
الحالات والأوراق البيضاء التى تتحدث عن تحليلات البيانات الضخمة. ما هى الفكرة الرئيسة 
المشتركة بين دراسات الحالة تلك؟ e‏ 

«teradatauniversitynetwork.com (3 -Y‏ $3 بإيجاد الأوراق البيضاء ل تحليلات 545 اطرئية, 
ودراسات الحالة» والتدريبات اليدوية. قم بإجراء تمارين التحليلات المرئية على مجموعات 
البيانات الضخمة ثم قم بإعداد تقرير لمناقشة النتائج التي توصلت إليها. 

Sports Analytics àz |J! «23! «teradatauniversitynetwork.com (3 -Y‏ قم بإيجاد 
تطبيقات البيانات الضخمة في الرياضة. لخص النتائج التي حصلت عليها. 

«teradatauniversitynetwork.com |J] «231 -€‏ وابحث عن مقاطع فيديو 851 التي تتكلم 
عن البيانات الضخمة. راجع هذه امقاطع» ثم أجب عن أسئلة الحالة ا متعلقة بها. 


WA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


-٥‏ اذهب إلى موقعي saa] 3l asterdata.coms teradata.com‏ قم بإيجاد على الأقل ثلاث دراسات 
حالة عملاء على البيانات الضخمة: واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
-١‏ اذهب إلى 2دم»./181. قم بإيجاد على الأقل ثلاث دراسات حالة عملاء على البيانات الضخمة 
واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
/- اذهب إلى 12010653.012. قم بإيجاد على الأقل ثلاث دراسات حالة عملاء على تنفيذ 
هادوب» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
8- اذهب إلى 22مء:1مهدم. قم بإيجاد على الأقل ثلاث دراسات حالة عملاء على تنفيذ هادوب» 
واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
9- اذهب إلى 201100190115.60122. قم بإيجاد على الأقل ثلاث دراسات حالة عملاء على تنفيذ 
هادوب» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
e3 .marklogic.com |J] «3l -V-‏ بإيجاد على الأقل ثلاث دراسات حالة عملاء على تنفيذ 
هادوب» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
-١١‏ اذهب إلى e 9:345 glia je Cool . youtube.com‏ حوسبة البيانات الضخمة. شاهد 
اثنين منهم على الأقل. لخّص النتائج التي حصلت عليها. 
۲- اذهب إلى :00816.6012/56110131ع وابحث عن مقالات عن تحليلات التيار. قم بقراءة ثلاث 
مقالات منها على الأقل. لخّص النتائج الخاصة بك. 
-١1'‏ ادخل على 00816.60171/5110131ع8: وابحث عن مقالات عن التنقيب في تيار البيانات. قم 
بقراءة ثلاث مقالات منها على الأقل. لخَّص النتائج الخاصة بك. 
ع -١‏ ادخل على «google.com/scholar‏ وابحث عن مقالات تتكلم عن البيانات الضخمة في مقابل 
مستودعات البيانات. قم بقراءة خمس مقالات منها على الأقل. لخَّص النتائج الخاصة بك. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wa‏ 


الفصل السابع 


المراجع: 

- Adshead, A. (2014). Data set to grow 10-fold by 2020 as Internet of Things takes off. http://www. 
computerweekly.com/news/2240217788/Data-set-to-grow-10-fold-by-2020-as-internet-of-things- 
takes-off (accessed September 2016). 

- Amodio, M. (2015). Salesforce adds predictive analytics to Marketing Cloud. Cloud Contact Center. 
cloudcontactcenter-zone.com/topics/cloud-contact-center/articles/41361 1-salesforce-adds-predictive- 
analytics-marketing-cloud.htm (accessed August 2016). 

- Asamoah, D., Sharda, R., Zadeh, A., & Kalgotra, P. (2016). Preparing a Big Data analytics professional: 
A pedagogic experience. In DSI 2016 Conference, Austin, TX. 

- Asamoah, D., & Sharda, R. (2015). Adapting CRISP-DM process for social network analytics: 
Application to healthcare. In AMCIS 2015 Proceedings. aisel.aisnet.org/amcis2015/bizAnalytics/ 
GeneralPresentations/33/(accessed July 2016). 

- Awadallah, A., & Graham, D. (2012). Hadoop and the data warehouse: When to use which. teradata.com/ 
white-papers/Hadoop-and-the-Data-Warehouse-When-to-Use-Which (accessed August 2016). 

- Broniatowski, D. A., Paul, M. J., & Dredze, M. (2013). National and local influenza surveillance through 
Twitter: An analysis of the 2012-2013 influenza epidemic. PloS One, 8(12), e83672. 

- Cisco. (2016). The zettabyte era: Trends and analysis. cisco.com/c/en/us/solutions/collateral/service- 
provider/visual-networking-index-vni/vni-hyperconnectivity-wp.pdf (accessed August 2016). 

- DataStax. Customer case studies. datastax.com/resources/case studies/eBay (accessed July 2016). 

- Davis, J. (2015). Salesforce adds new predictive analytics to Marketing Cloud. Information Week. 
informationweek.com/Big-data/Big-data-analytics/salesforce-adds-new-predictive-analytics-to- 
marketing-cloud/d/d-id/1323201 (accessed August 2016). 

- Dean, J., & Ghemawat, S. (2004). MapReduce: Simplified data processing on large clusters. research. 
google.com/archive/mapreduce.html (accessed August 2016). 

- Delen, D., Kletke, M., & Kim, J. (2005). A scalable classification algorithm for very large datasets. 
Journal of Information and Knowledge Management, 4(2), 83-94. 

- Dillow, C. (2016). What happens when you combine artificial intelligence and satellite imagery. fortune. 
com/2016/03/30/facebook-ai-satellite-imagery/(accessed July 2016). 

- Ekster, G. (2015). Driving investment performance with alternative data. integrity-research.com/wp-content/ 
uploads/2015/11/Driving-Investment-Performance-With-Alternative-Data.pdf (accessed July 2016). 

- Henschen, D. (2016). Salesforce reboots Wave Analytics, preps IoT cloud. ZD Net. zdnet.com/article/ 
salesforce-reboots- wave-analytics-preps-iot-cloud/(accessed August 2016). 

- Higginbotham, S. (2012). As data gets Bigger, what comes after a yottabyte? gigaom.com/2012/10/30/ 
as-data-gets- Bigger-what-comes-after-a-yottabyte (accessed August 2016). 


Wwe‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


- Hope, B. (2015). Provider of personal finance tools tracks bank cards, sells data to investors. Wall 
Stret — Journal.wsj.com/articles/provider-of-personal-finance-tools-tracks-bank-cards-sells-data-to- 
investors-1438914620 (accessed July 2016). 

- Jonas, J. (2007). Streaming analytics vs. perpetual analytics (Advantages of Windowless Thinking). 
jeffjonas.typepad.com/jeff jonas/2007/04/streaming analy.html (accessed August 2016). 

- Kalgotra, P., & Sharda, R. (2016). Rural versus urban comorbidity networks. Working Paper, Center for 
Health Systems and Innovation, Oklahoma State University. 

- Kelly, L. (2012). Big data: Hadoop, business analytics, and beyond. wikibon.org/wiki/v/Big Data: - 
Hadoop, Business Analytics and Beyond (accessed August 2016). 

- Lampitt, A. (2012). Big data visualization: A Big deal for eBay. infoworld.com/d/Big-data/Big-data- 
visualization-Big-dealebay-208589 (accessed August 2016). 

- MarkLogic. (2012). Top 5 investment bank achieves single source of truth. marklogic.com/resources/ 
top-5-derivatives-trading-bank-achieves-single-source-of-truth (accessed July 2016). 

- Moran, P. A. (1950). Notes on continuous stochastic phenomena. biometrika, 17-23. 

- Orbital Insight. World Oil Storage Index. orbitalinsight.com/solutions/world-oil-storage-index/ 
(accessed July 2016). 

- Russom, P. (2013). Busting 10 myths about Hadoop: The Big Data explosion. TDWT' Best of Business 
Intelligence, 10, 45-46. 

- Sarasohn-Kahn, J. (2008). The wisdom of patients: Health care meets online social media. Oakland, CA: 
California HealthCare Foundation. 

-Shaw, C. (2016). Satellite companies moving markets. quandl.com/blog/alternative-data-satellite- 
companies (accessed July 2016). 

- Steiner, C. (2009). Sky high tips for crop traders (accessed July 2016). 

- St Louis, C., & Zorlu, G. (2012). Can Twitter predict disease outbreaks? BM], 344. 

- Tableau white paper. (2012). 7 Tips to succeed with Big Data in 2013. cdnlarge.tableausoftware.com/ 
sites/default/files/whitepapers/7-tips-to-succeed-with-Big-data-in-2013.pdf (accessed August 2016). 

- Thusoo, A., Shao, Z., & Anthony, S. (2010). Data warehousing and analytics infrastructure at Facebook. In 
Proceedings of the 2010 ACM SIGMOD International Conference on Management of Data (p. 1013). 

- Turner, M. (2015). This is the future of investing, and you probably can't afford it. businessinsider.com/ 
hedge-funds-are-analysing-data-to-get-an-edge-2015-8 (accessed July 2016). 

- Watson, H. (2012). The requirements for being an analytics-based organization. Business Intelligence 
Journal, 17(2), 42-44. 

- Watson, H., Sharda, R., & Schrader, D. (2012). Big Data and how to teach it. Workshop at AMCIS, 
Seattle, WA. 

- White, C. (2012). MapReduce and the data scientist. Teradata Aster White Paper. teradata.com/white- 
paper/MapReduce-and-the-Data-Scientist (accessed August 2016). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ww‏ 


الفصل السابع 


- Wikipedia.com. "Petabyte."en.wikipedia.org/wiki/Petabyte (accessed August 2016). 


- Zadeh, A. H., Zolbanin, H. M., Sharda, R., & Delen, D. (2015). Social media for nowcasting the flu activity: 
Spatial-temporal and text analysis. Business Analytics Congress, Pre-ICIS Conference, Fort Worth, TX. 


- Zikopoulos, P., DeRoos, D., Parasuraman, K., Deutsch, T., Corrigan, D., & Giles, J. (2013). Harness the 
power of Big Data. New York: McGraw-Hill. 


AY‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل الثامن 
الاتجاهات المستقبلية والخصوصية 
والاعتبارات الإدارية في التحليلات 


أهداف التعلم: 
- استكشاف بعض التقنيات حديثة الظهور التي قد توثر على التحليلات» وذكاء الأعمالء ودعم القرار. 
- وصف الظاهرة حديثة الظهور المعروفة باسم إنترنت الأشياء (101): والتطبيقات ال محتملة 
والنظام الاقتصادي لظاهرة (إنترنت الأشياء). 

- وصف الاستخدام الجاري والمستقبلي للحوسبة السحابية في تحليلات الأعمال. 
- وصف كيفية مساعدة التحليلات المبنية على الجغرافية المكانية والموقع للمنظمات. 
- وصف التأثيرات التنظيمية لتطبيقات التحليلات. 
- سرد ووصف القضايا الأخلاقية والقانونية الرئيسة لتنفيذ التحليلات. 
- تحديد الخصائص الرئيسة لمحترفي علم البيانات الناجح. 

يقدم هذا الفصل عدة تقنيات حديثة الظهور والتي من المحتمل أن تكون ذات تأثيرات جوهرية 
على تطوير واستخدام تطبيقات ذكاء الأعمال. وفي مجال حركي كالتحليلات» فإن المصطلحات أيضًا 
تتطور وتتداخل. وكما سبق ذكره. فيمكننا الرجوع إلى هذه التقنيات مثل ذكاء الأعمالء أو 
التحليلاتء أو علم البيانات: أو تعلم الآلة. أو الذكاء الاصطناعي (41): أو الحوسبة المعرفية» أو 
البيانات الضخمة: أو العديد من العناوين الأخرى. وليس هدفنا هو التركيز على الفروق الطفيفة 
بين كل منهاء ولكن الهدف هوالتعامل معهم جميعًا ككوكبة كبيرة واحدة. إننا نركز على بعض 
الاتجاهات التي تحققت بالفعل وعاى البعض الآخر ا متوقع أن يؤثر بصورة أكبر على التحليلات. 
ودائمًا ما يعد استخدام كرة كريستال اقتراحًا منذرًا بالخطرء ولكن في ه ذا الفصل نقدم تحليلًا 
لبعض اللمجالات النامية. كما نقدم ونشرح بعض التقنيات حديثة الظهور وكذلك نستكشف بعض 
تطبيقاتها ال معاصرةء ثم نناقش بعد ذلك التأثيرات التنظيمية والشخصية والقانونية والأخلاقية 
والاجتماعية لأنظمة الدعم التحليلي والقضايا التي يجب أن يهتم بها مديرو ومحترفو التحليلات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Wr‏ 


الفصل الثامن 


۱-۸ مقال افتتاحى: تحليل بيانات الاستشعار يساعد سيمنس (Siemens)‏ 
على تجنب أعطال القطارات: 

تعتبر شركة 5162625 أكبر منتج في العام لتقنيات كفاءة الطاقة وتوفير ال موارد. يقع المقر 
الرئيسي للشركة في برلين بأمانياء بعائدات ٩۳‏ مليار دولار سنويًا. تنتج 5٠ء81‏ قطارات متنوعة 
ومكونات بنية تحتية تشبه أنظمة التحكم وأنظمة الطاقة. 

يعتقد فريق خدمات نقل البيانات التابع لشركة 5162625 أن تحليلات البيانات الضخمة 
وإنترنت الأشياء (101) يستطيع أن يمكنهم من توقع أخطاء المكونات لأسابيع قادمة. إنهم 
يستكشفون هذه الأساليب للتأكد من عدم ترك أي قطار محجوز على المسارات بسبب أعطال 
فنية غير متوقعة. وتريد 51612615 الانتقال من الصيانة التفاعلية (بعد الحادث) والصيانة 
الوقائية (بعمليات التفتيش المنتظمة) إلى الصيانة التنبؤية للقطارات. 

تقيس أجهزة الاستشعار المتصلة بمكونات قطاراتها الموقف الحالي للمكونات. حيث تقوم شركة 
5 بجمع وتحليل بيانات جهاز الاستشعار بشكل فوري تقريبًا. وإذا تم العثور على أي شذوذ 
في البيانات» فهذا يشير إلى احتمال عطل أحد المكونات. وبالتالي» يممكن اتخاذ تدابير وقائية وفقًا لذلك. 

وفقًا لمدونة تيراداتاء يعتمد مهندسو 51611625 على بيانات عشرات الآلاف من أجهزة الاستشعار. 
تذهب كل من بيانات القطارات والسكك الحديدية» وبيانات عمليات الإصلاح» وبيانات الطقس» 
وبيانات سلاسل التوريدء إلى بنية البيانات الموحدة تيراداتا التابعة لشركة 516216115 للاستفادة من 
Teradata Asters Hadoop‏ ومستودع بيانات تيراداتا. وصرح 12655 6611210 مدير فريق 
خدمات نقل البيانات بشركة 5162605 قائلًا: « لا هكننا أن نفعل ما نفعله بناءً على بنية مختلفة 
لأن أحجام البيانات لدينا كبيرة جدًا. ولذا؛ فمثلًا بالنسبة لأسطول سيارات من أوروباء قمنا بجمع 
كل بيانات أجهزة الاستشعارء وكانت حوالي ٠٠١‏ مليار سطرًا جدوليًا. وإذا كنت ترغب في تنفيذ 
خوارزمية تعلم الآلة على ذلك فهي لا تعمل على شيء ليس موازياً بشكل كبير». 

يسمح تعلم الآلة باستخدام بيانات جهاز الاستشعار لعلماء ومهندسي البيانات بشركة 
5 من الكشف السريع عن الإيجابيات الخاطئة (التنبؤ بعطل لا يحدث فعلًا) وإعطاء 
تنبو واضح بأعطال الجزء الفعلي. ولأن الإنذارات الكاذبة تكون أكثر من الإنذارات الحقيقية. 
تقوم المنظمة بالنظر في أوامر العملء والأرقام التسلسلية» وتاريخ بيانات القطارات والخدمات» 
ومعلومات التشخيصء وبيانات جهاز الاستشعارء وعمليات الإصلاح؛ وبيانات سلاسل التوريد 
للمساعدة في تحديد وحل أعطال الجزء الحقيقي. وتستطيع ol Siemens‏ 2425 48.5 أيهما 
أكثر عرضة للعطل» هل هو القطار فائق السرعة بين موسكو وسانت بتسبرج في الشتاء القارس 
أم القطار فائق السرعة في إسبانيا الحارة في أيام الصيف. وذلك عن طريق دمج بيانات الطقس. 


E‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


يستخدم مشغل القطار الأسباني 815:37155 المكونات الأساسية لقطار 516265 عالي السرعة, 
«Valero E‏ الخاضع للمراقبة المستمرة من جانب BE „Siemens‏ كانت أتماط بيانات جهاز الاستشعار 
التي تم جمعها غير طبيعية» يتم إرسال فريق للتحقق من هذه المكونات» وبالتالي نع عطل القطار 
على المسارات. وكنتيجة لذلكء لم يتأخر بشكل ملحوظ سوى قطار واحد فقط من أصل ۲۲۰۰ قطار. 
وتزعم 51672625 أيضًَا أن المصداقية المرتفعة لقطاراتها قد ساعدت الكثير من مشغلي القطارات على 
تحسين أدائهم فيما يتعلق بالوقت المناسب. فعلى سبيل المثال» تعمل قطارات بانكوك بنسبة تأخير 
١‏ فقط. وتقدّر 5162625 كذلك أن التشغيلات التي يمكن الاعتماد عليها بشكل كبير بين برشلونة 
ومدريد قد أدت إلى زيادة معنوية في عدد ركاب القطارات وتقليص حركة الملاحة الجوية. 

وهكذاء تكون النمذجة التنبؤية قد منحت 51612605 فرصة خدمية جديدة. لقد تم تأسيسها 
الآن كمورد رئيس لخدمة تتبع أعطال القطارات. وسيصبح بيع هذه الخدمات التنبؤية أكثر 
أهمية من مجرد المعدات الأصلية. 
ما هى الدروس التى يمكننا تعلمها من هذه المقالة الافتتاحية؟ 

تقود Siemens‏ تطوير الخدمات الإضافية والقيمة للمنتجات الصناعية الضخمة القادمة من 
الصناعات الكبيرة نسبيًا؛ إذ هكن للشركة إنشاء صورة أفضل لطريقة أداء منتجاتها على أرض الواقع 
وذلك من خلال استعمال أجهزة الاستشعار التي تولد كميات كبيرة ومتنوعة من البيانات ودمج تلك 
البيانات مع مصادر البيانات الأخرى مثل الطقس. وعلاوةً على ذلك. فإن تحليل مثل هذه البيانات 
قد يساعد العميل على أداء الصيانة فقط عندما يلزم ذلك وليس وفقًا لجدول زمني. ولقد أصبح بيع 
Jio‏ هذه الخدمات التحليلية محور اهتمام أساسي جديد بالنسبة لجميع المنتجين الرؤّاد للمعدات 
chf okus go s LS General Electricg Siemens Jis &sla)l‏ التحليلات على المنتجات 
والصيانة التنبؤية أو الإصلاحات مثالًا ممتازًا لإنشاء فرص تسويقية جديدة للمنتجات القائمة. 
أسئلة للمناقشة: 
-١‏ في مجال المعدات الصناعية مثل القطارات. ما هي المَعْلَمات التي يمكن قياسها بانتظام لتقدير 

الأداء الحالي للمعدات والإصلاحات اللازمة مستقبلًا؟ 
۲- كيف هكن أن نستفيد من بيانات الطقس في تحليل حالة معدات القطارات؟ 
-Y‏ 48) كمية البيانات التي تحتاج لجمعها في شهر واحد باستخدام مثلًا ٠٠٠١‏ جهاز استشعار على 

قطار واحد. JS ob Gle‏ جهاز استشعار يعطي ١‏ كيلوبايت من البيانات في الثانية الواحدة. 
ع- ما هو تصورك لتخزين مثل هذه المجموعات من البيانات؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري o‏ 


الفصل الثامن 


۸ إنترنت الأشياء: 

قدمت المقالة الافتتاحية مجالًا يواجه نموًا كبيرَا ف الوقت الراهن. يعتبر إنترنت الأشياء (101) 
ظاهرة لربط العام المادي بالإنترنت» بخلاف إنترنت الأشخاص الذي يربط البشر ببعضهم البعض 
من خلال التقنية. ففي إنترنت الأشياء» تتصل الأجهزة المادية بأجهزة الاستشعار التي تجمع بيانات 
عن الجهاز مثل التشغيل والموقع والحالة الراهنة. تتم معالجة هذه البيانات باستخدام أساليب 
تحليلية متنوعة للراقبة الجهاز عن بُعد من مكتب مركزي أو للتنبؤ بأي أخطاء قد تحدث للجهاز. 
ولعل المثال الأشهر على إنترنت الأشياء هو السيارة ذاتية القيادة. ولي تقود نفسها بنفسهاء تحتاج 
السيارة وجود أجهزة استشعار كافية لمراقبة الموقف تلقائيًا من حولها وتتخذ الإجراءات الملانئمة 
لضبط أي إعداد لازم بما في ذلك سرعة السيارة واتجاهها وما إلى ذلك. ومن الأمثلة الشائعة الأخرى 
على إنترنت الأشياء هو جهاز متتبع اللياقة الذي يسمح للمستخدم بتتبع أنشطته الجسدية كالمثي 
والجري والنوم. وتعد شركة ST Stio Smartbin‏ لتوضيح ظاهرة إنترنت الأشياء. فقد قامت 
ةل بتطوير حاويات القمامة ذات أجهزة استشعار للكشف عن مستويات الامتلاء؛ حيث 
يقوم جهاز الاستشعار بإخطار شركة جمع القمامة تلقائيًا بأن الحاويات قد امتلأت تقريبًا وتحتاج 
للتفريخ. وبالطبع» يعد المثال الأكثر شيوعًا الذي يضربه الناس لتوضيح إنترنت الأشياء هو فكرة 
طلب الثلاجة للحليب تلقائيًا عندما تكتشف أن الحليب قد نفد. وقدمت شركة كلوروكس فلتر 
4 الجديد المزود بوعاء به 101-11 يستطيع طلب فلاتر المياه بنفسه عند اكتشاف وقت التغيير. 
في كل هذه الأمثلة, لا يضطر البشر إلى التواصل مع بعضهم البعض» ولا حتى مع أي آلة في كثير 
من الحالات؛ حيث تستطيع الآلات أن تتكلم. وهذا هو سبب استخدام مصطلح إنترنت الأشياء. 

وفقًا لبحث LLLI özg JI älyk (Y-Y) Juniper‏ والهواتف الذكية والحواسيب 
الشخصيةء سيتم ربط أكثر من ۲۸ مليار شيء بالإنترنت وذلك بحلول عام .۲٠٠١‏ وفيما يلي بعض 
الأسباب للنمو الكبير في إنترنت الأشياء: 
]- كون الأجهزة أضغر حجمًا وأرخض سعًا وأكتراقوةٌ: 'لقد اتخفضت تكاليف اللشغلات وأجهزة الاستشعار 

بشكل كبير في العشر سنوات المنصرمة» مما أدى بشكل عام لإنتاج جهاز استشعار أرخص كثيراً. 


-٠"‏ إمكانية التنقل الرخيصة: وقد انخفضت كذلك تكاليف معالجة البيانات والسعة التنزيلية 
وأجهزة الجوال بنسبة ZAV‏ منذ العقد الماضي. 





Source: Adapted from teradata.com (2016). The Internet of trains. http:// www.teradata.com/resources/ 
case-studies (accessed August 2016); theit.org. (2016). Siemens tracks Big Data for trains that keep on 
running. http:// eandt.theiet.org/magazine/2016/07/siemens-Big-data-trains.cfm (accessed August 2016); 


Siemens.com (2016). About Siemens. http:// www.siemens.com/about/en/(accessed August 2016). 


wi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


-٠‏ توافر أدوات ذكاء الأعمال: تعرض الآن الكثير والكثير من الشركات أدوات ذكاء الأعمال الخاصة 
بها سواء على أجهزتها أو على السحابة بمعدلات أقل. وتكون أدوات البيانات الضخمة وذكاء 
الأعمال متاحة على نطاق واسع وبصورة متطورة للغاية. 

ع- تظهر يوميًا بشكل افتراضي حالات استخدام جديدة ومثيرة. 


كما ينبغي علينا ملاحظة وجود بعض التعارض حول استخدام مصطلح إنترنت الأشياء. وأيضًا 
يطلق عليه البعض مصطلح ويب الأشياء و8هنط1 06 11765: ويسميه البعض الآخر إنترنت الأنظمة 
لأنه في العديد من الطرق سيكون هناك توليفة من الأنظمة التي تتواصل فيما بينها. عمومًاء سنشير 
في هذا الفصل لهذه الظاهرة باسم إنترنت الأشياء (101) لتحقيق الاتساق. 
وتختلف التقديرات على نطاق واسع فيما يخص نمو صناعة إنترنت الأشياءء في حين سيتم 
إنفاق مبلغ يتراوح ما بين 1 تريليون و١١‏ تريليون دولار تقريبًا على حلول إنترنت الأشياء بقدوم 
عام ٠٠٠٠١‏ والتي تعد واحدة من أسرع قطاعات تقنية المعلومات نموًا بشكل عام وعنصرًا أساسيًا 
في صناعة التحليلات. وتعطي الحالتان العملیتان (۱-۸) و(۲-۸) مثالين لتطبيقات إنترنت الأشياء 
في صناعات مختلفة باستخدام منصتین تقنیتین مختلفتين. 
حالة عملية ١-8‏ 
شركة زوارق 511761110016 تستخدم تحليل البيانات الفوري 
لإخطار المتسابقين وا مشجعين 
تعتبر زوارق 811۷۵۲۲1٥0)‏ إحدى أسرع القوارب ف العام والأكفاً في استهلاك الطاقة 
والتي تصنعها شركة تحمل نفس الاسم. وتستخدم زوارق 511161110016 في جميع 
سباقات الزوارق حول العالم. تواجه القوارب المنطلقة بسرعات عالية ضد اللياه المالحة 
خطر عطل المعدات. ويعتمد المتسابقون على بيانات القياس عن يُعد من قواربهم 
لاتخاذ قرارات تتعلق بالسلامة والتخطيط. وفي بعض المواقفء يتم Obl gaz Lao‏ 
القياس الحيوية للمتسابقين. وبالتاليء يستقبل المتسابقون الكثير من ال معلومات» مما 
Uia‏ تتبع كل البيانات. كما لاحظت 511765110016 أن جمهور سباقات الزوارق كانوا 
يواجهون صعوبة لمتابعة المتسابقين في المحيط» كلما انطلقت القوارب بسرعة. مما قلل 
من تعلق الجمهور باللعبة. وقد جمعت 51176111001 البیانات من ۸۰ جهاز استشعار 
ولكن لم تكن هناك طريقة سهلة للحصول على أفكار لتحسين قدرات اتخاذ القرار 
واتخاذ قرارات السلامة وتحسين تجربة الجمهور. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري AV‏ 


الفصل الثامن 


استخدم فريق 511761110016 منصة <ند8[6 181/1 كخدمة 2885 (انظر القتسم 
التالي) لاستخدام حلول تحليلات 5855 IBM‏ وتوصيل أفكار مفهومة للمستخدمين 
والجماهير. وقد تمكنت 51176111001 عن طريق 2335 من إنشاء تطبيقات» وسحب 
بيانات في السحابة» وإجراء التحليلات المطلوبة على تلك البيانات. واستخدم 180/1 
×uemiاB‏ بالاشتراك مع شركة ٥ر٤‏ 1٤۷1ء‏ قاعدة إنترنت الأشياء لإرسال بيانات 
الاستشعار المتولدة من أجهزة الاستشعار ونظام تحديد Ji (GPS) (LJ! e Sls‏ 
السحابة. وقد تم إجراء تحليل على بيانات جهاز الاستشعار باستخدام أدوات التحليل 
ا موجودة في .IBM Bluemix‏ كما قامت عتز8 171121 بتوصيل تنبيهات المعلومات 
الفنية للفريق المتسابق والتمثيل الفوري للسباق إلى الجماهير. والآن يستطيع 
المتسابقون الحصول على رؤية فورية عن السباق» لتحسين قراراتهم وقدرتهم التنافسية. 

أسئلة للمناقشة: 

-١‏ ما هو نوع المعلومات المهمة للمتسابقين والتي يمكن أن تنشئها أجهزة الاستشعار 
على قارب السباق؟ وماذا عن الجماهير؟ 

۲- ما هي الرياضات الأخرى التي يمكن أن تستفيد من تقنيات مشابهة؟ 

- ما هي التحديات التقنية التي يمكن أن تواجهها في إنشاء مثل هذه الأنظمة؟ 


Sources: IBMBigdatahub.com. (2015). SilverHook Powerboats: Tracking fast-moving 
boats in real time. http://www.ibmBigda-tahub.com/blog/silverhook-powerboats-tracking- 
fast-moving-powerboats-real-time (accessed August 2016); IBM.com (2015). Case study: 
SilverHook Powerboats. http://www.ibm.com/cloud-computing/case studies/silverhook- 


powerboats.html (accessed August 2016). 
۲-۸ حالة عملية‎ 
Gil åJ jbg bàil Slul Jyo öls Rockwell Automation شركة‎ 

تعتبر شركة Rockwell Automation‏ ]$2 $1 شركات توريد حلول التشغيل الآلي 
الصناعي والمعلومات الصناعية في العاط؛ إذ ينتشر عملاؤها في أكثر من 6١‏ دولة حول 
lol‏ ويعمل بها حوالي 70٠١‏ موظف. وترتكز الشركة في عملها على عدة مجالات: يعد 
أحدها مساعدة شركات النفط والغاز في الاستكشاف. ومن أمثلة ذلك شركة ۲ه ازا 
En‏ وهي شركة تقوم بالتنقيب عن النفط في ألاسكاء وهي تستخدم معدات غالية 


M‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


الثمن جدًا في الحفر والاستخراج وتكرير النفطء ويمكن لعطل واحد في المعدات أن يكلف 
شركة النفط والغاز فاقد إنتاج بما يتراوح من ٠٠١‏ ألف إلى ٠١‏ ألف دولار في اليوم. 
ويتطلب التعامل مع هذه المشكلة وجود تقنية يمكنها مراقبة حالة مثل هذه المعدات عن 
cass‏ كما يمكنها التنبق بالمشكلات التي من المحتمل أن تحدث بشكل جيد في وقت مبكر. 
Automation cLa:l‏ 1ا155ء10 هذه الفرصة لتوسيع أعمالها في صناعات النفط 
والغاز من خلال جمع البيانات من مواقع الاستكشاف وتحليلها لتحسين الكفاءة وقيادة 
الأداء بشكل أفضل. وتحصل الشركة على رؤيتها من 156:م :1:16 0026160 باستخدام 
إنترنت الأشياء التابعة لمايكروسوفت (811650501) لتوفير مراقبة ودعم معدات النفط 
والغاز التي ÉK Jas‏ $ مناطق بعيدة. وتوفر Sal oV! Rockwell Automation‏ 
للتنبؤ الفوري بأعطال المعدات على طول سلاسل توريد البترولء ومراقبة صحتها وأدائهاء 
والمساعدة في منع عطلها في المستقبل. وتتركز هذه الحلول في المجالات التالية: 

-١‏ الحفر: تمتلك شركة Hilcorp Energy‏ معدات الضخ الخاصة بها المتمركزة 
في ألاسكاء حيث تقوم بالتنقيب عن النفط ۲٤١‏ ساعة في Kgs eol‏ لعطل واحد في 
المعدات أن يكلف الشركة الكثير من ال مال. وقامت Rockwell Autom a10٥٩‏ بربط 
المشغلات الكهربائية المتغيرة لمعدات الضخ بالسحابة (انظر (YUI gaill‏ بحيث يمكن 
التحكم في هذه الآلات على بعد آلاف الأميال من غرفة التحكم في أوهايو؛ إذ تقوم 
أجهزة الاستشعار بالتقاط البيانات: وتمريرها إلى &»b os Microsoft Azure Cloud‏ 
بوابة التحكم الخاصة بشركة 1801511: ثم تصل هذه البيانات إلى المهندسين التابعين 
Hilcorp Energy J‏ من خلال لوحات معلومات رقمية» فتقوم لوحات ال معلومات هذه 
بعرض معلومات عن الضغط ودرجة الحرارة ومعدل التدفق وعشرات اللَعْلّمات الأخرى 
بشكل آني مما يساعد المهندسين على مراقبة صحة وأداء المعدات. كما تعرض لوحات 
المعلومات هذه تنبيهات عن أي مشكلات محتملة. فعندما تعطلت إحدى قطع معدات 
الضخ الخاصة بشركة م:1110]: تم تحديد العطل وتعقبه وإصلاحه في أقل من ساعة» 
مما أدى لتوفير ١‏ ساعات من تعقب العطل والتكلفة الناجمة عن فاقد الإنتاج. 

'- بناء مضخات غاز أذى: في هذه الأيام» تقوم بعض شاحنات النقل باستخدام الغاز 
الطبيعي السائل كوقود. وتقوم شركات النفط بتحديث محطات تعبئة الوقود الخاصة بها 
لدمج مضخات الغاز الطبيعي السائل. کما قامت شرکة Cadi Rockwell Automation‏ 
أجهزة استشعار ومشغلات تردد متغير على هذه الشاحنات لجمع بيانات فورية عن 
تشغيل المعدات ومخزون الوقود ومعدل الاستهلاك. وتتم إحالة هذه البيانات إلى منصة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري m‏ 


الفصل الثامن 


السحابة الخاصة بشركة 1805611 والتي تقوم بدورها بإنشاء لوحات معلومات تفاعلية 
وإعداد تقارير لوصف هذه التفاصيل باستخدام 421156 1116505016 ومن ثم إرسالها إلى 
المستفيدين الملائمين. مما يعطي انطباعًا مريحًا للمستفيدين عن سلامة أصول رأسمالهم. 

لقد عملت حلول «Je Rockwell 4$ 5 5 s 4sAal Connected Enterprise‏ 
زيادة سرعة نمو العديد من شركات النفط والغاز مثل شركة ò Hilcorp Energy‏ 
خلال وضع بيانات العمليات الخاصة بها على منصة السحابة ومساعدتها على تقليل 
التكلفة الناجمة عن أوقات الأعطال والصيانة. ونتج عن هذا ظهور فرص عمل جديدة 
للمصنعين الشجعان Rockwell Automation Jà‏ 

أسئلة للمناقشة: 


-١‏ ما هو نوع المعلومات التي من المرجح أن يتم جمعها من قبّل منصة التنقيب 
عن النفط والغاز؟ 

"'- هل يتناسب هذا التطبيق مع الثلاث 175 (الحجم والتنوع والسرعة) الخاصة 
بالبيانات الضخمة؟ اذا نعم أو IY SU‏ 

- ما هي الصناعات الأخرى التي يمكنها استخدام مقاييس تشغيلية ولوحات 
معلومات مشابهة؟ 
Sources: Customers.microsoft.com. (2015). Rockwell Automation: Fueling the oil‏ 
and gas industry with IOT. https://customers.microsoft.com/Pages/CustomerStory.‏ 


aspx?recid-19922 (accessed August 2016); Microsoft.com. (n.d.). Customer stories| 
Rockwell Automation. https://www.microsoft.com/en-us/cloud-platform/cus- tomer- 


stories-rockwell-automation (accessed July 2016).‏ 
البنية التحتية لتقنية إنترنت الأشياء: 
من نظرة بعين الطائر, يمكن تقسيم تقنية إنترنت الأشياء إلى أربع مجموعات رئيسة والموضحة 
في الشكل igk LS (V-A)‏ 
-١‏ الأجهزة oU 8582 I s 235 (Hardware)‏ وأجهزة الاستشعارء والمشغلات الميكانيكة 
التي يتم فيها إنتاج وتسجيل البيانات. والأجهزة هي المعدات التي تحتاج إلى التحكم فيها أو 
مراقبتها أو تتبعها. وقد تحتوي أجهزة الاستشعار الخاصة بتقنية إنترنت الأشياء على معالج 
أو أي جهاز حوسبة والذي يقوم بتوزيع البيانات الواردة. 


Wwe‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


(Connectivity) JLaYI -Y‏ ينبغي أن يكون هناك محطة أساسية أو مركز رئيس يقوم بجمع 
البيانات من القطع المزودة بأجهزة الاستشعار وإرسال تلك البيانات إلى السحابة. يتم ربط 
الأجهزة بشبكة لتتواصل مع بعضها البعض أو مع تطبيقات أخرىء وقد يكون هذا الربط 
مباشر أو غير مباشر بالإنترنت. وتعمل البوابة على تمكين الأجهزة غير المتصلة مباشرةً بالإنترنت 
من الوصول إلى منصة السحابة. 

(Software backend) iayl àla -Y‏ وفي هذه الطبقة» تتم إدارة البيانات التي تم 
جمعها؛ حيث تقوم الخلفية البرمجية بإدارة الشبكات والأجهزة وتوفير تكامل البيانات. وقد 
يكون هذا جيدًا جدًا في السحابة (انظر القسم التالي ثانية). 

-٤‏ التطبيقات: وف هذا الجزء من إنترنت الأشياء» يتم تحويل البيانات إلى معلومات ذات معنى. 
وقد يتم تشغيل العديد من التطبيقات على الهواتف الذكية وأجهزة التابلت وأجهزة الحاسب 
الشخصي وتقوم بعمل شي مفيد مع البيانات. كما يتم تشغيل تطبيقات أخرى على الخادم 
ومن ثم تقديم نتائج أو تنبيهات من خلال لوحات المعلومات أو الرسائل إلى المختصين. 


Q%‏ و 
D‏ 
fons‏ | ینت 
RS‏ 








شكل 1-8: بناء كتل البنية التحتية لتكنولوجيا IOT‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 1 








الفصل الثامن 


أجهزة استشعار التعريف بترددات الراديو 1819: 


تعتبر تقنية التعریف بترددات الرادیو(۸۴12) واحدة من أقدم تقنيات الاستشعار الموجودة 
والتي تشهد نموا کبرً. وتعتبر ۸۴1 تقنية شاملة تشي إلى استخدام موجات تردد الراديو 
m‏ الأهداف. وبشكل أساسيء تعد هذه التقنية مثالًا لعائلة تقنيات تحديد الهوية تلقائيًّه 
والتي تشمل أيضًا الباركود والقضبان المغناطيسية واسعة الانتشارء حيث استخدمت سلاسل 
توريد التجزئة (والعديد من المجالات الأخرى) منذ منتصف السبعينيات تقنية الباركود كشكل 
أساسي لتحديد الهوية تلقائيًا. وقد روجت مزايا ۸۴12 المحتملة لانتهاج هذه التقنية بقوة إلى 
العديد من الشركات (بقيادة كبرى شركات التجزئة مثل 56ة101701-1/1: (Dillard'ss .Targets‏ 
كطريقة لتحسين سلاسل التوريد الخاصة بهم وبالتالي تقليل التكاليف وزيادة المبيعات. 

كيف تعمل تقنية ۸۴12؟ ف أبسط صورة له یتکون نظام ۸۴12 من علامة (متصلة بالمنتج المراد 
التعرف عليه)» وأداة استجواب (عنى قارئ)» وهوائي واحد أو أكثر متصلين بالقارئ» وجهاز حاسب 
(للتحكم في القارئ والتقاط البيانات). وحاليًاه بدأت سلاسل التوريد في الاهتمام أكثر باستخدام 
علامات 11811 غير المباشرة؛ إذ تستقبل العلامات غير المباشرة الطاقة من المجال الكهرومغناطيسي 
الذي أنشأته أداة الاستجواب (وليكن القارئ) وا معلومات المرتدة فقط عندما يتم طلبها. وتظل 
العلامة غير المباشرة نشطة فقط عندما تكون داخل المجال المغناطيسي لأداة الاستجواب. 

وفي المقابلء يكون لدى العلامات المباشرة بطارية على لوح مسطح لتنشيطها. وحيث إن لدى 
العلامات المباشرة مصدر طاقة خاضًا بها فهي لا تحتاج قارنًا لتنشيطها؛ بل يمكنها الشروع في عملية 
نقل البيانات من تلقاء نفسها. وبا مقارنة مع العلامات غير المباشرة» فإن للعلامات المباشرة نطاق 
قراءة أطول ودقة أفضل وتخزين معلومات أكثر تعقيدًا قابلًا لإعادة الكتابةء وقدرات معالجة أكثر 
ثراءً )2005 «d JUI 5529) 555 55Js .(Moradpour & Bhuptani,‏ يكون للعلامات المباشرة 
بعض السلبيات» ومنها أن فترة حياتها تكون أقصرء وحجمها أكبرء وثمنها أغلى من العلامات غير 
المباشرة. وحاليّه يتم تصميم وتشغيل معظم تطبيقات بيع التجزئة بعلامات سلبية. وغالبًا ما 
يتكرر وجود العلامات المباشرة في أنظمة الدفاع أو العسكرية» ولكنها تظهر كذلك في تقنيات مثل 
EZ Pass‏ حيث ترتبط العلامات بحساب مدفوع مقدمًاء مما GS‏ السائقين من دفع الرسوم أثناء 
القيادة فقط بالمرور على القارئ بدلا من التوقف للسداد عند كشك تحصيل الرسوم. 

يعد تمثيل البيانات الأكثر انتشارًا بالنسبة لتقنية 187:17 هو رمز المنتج الإلكتروني (820)» 
والذي ينظر إليه العديد من العاملين في الصناعة على أنه الجيل التالي من رمز المنتج العالمي 


14۲ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


EPC og% UPC والذي يتم تمثيله في الغالب بما يسمى باركود. وكما هوالحال في‎ (UPC) 
من سلسلة من الأرقام التي تحدد أنواع المنتجات والمصنعين عبر سلاسل التوريد. كما يتضمن رمز‎ 
مجموعة إضافية من الأرقام لتحديد العناصر بشكل فريد.‎ 850 

وفي الوقت الحاليء تحتوي معظم علامات e RFID‏ 51 بايت من البيانات في شكل أرقام 
تعريف التجارة العالمية المسلسلة (56:11715) لتحديد حالات أو رموز حاوية الشحن المسلسلة 
لتحديد لوحات التنزيل (على الرغم من إمكانية استخدام LÍ SGTINS‏ لتحديد لوحات التنزيل). 
ويمكن إيجاد الدليل الكامل لوضع علامة معايير البيانات على موقع الويب الخاص بشركة 
.(epcglobalinc.org) 5 EPCglobal‏ 2559 .5 شركة 82081081 منظمة يشترك في قيادتها 
رواد الصناعة والمنظمات التي تركز على إنشاء معايير عالمية ل E۲٥‏ لدعم استخدام ۸۴1۲. 


وكما هو موضح في الشكل (7-1). تظهر بيانات العلامات في أنقى صورها عبارة عن سلسلة من 
الأرقام الثنائية» والتي يمكن تحويلها بعد ذلك إلى المعادل العشري 561171. aes uasa le Ss‏ 
11 بشكل أساسي 1710 (1100-14 لتحديد حاوية الشحن) برقم مسلسل. ويعتبر الرقم 
ال مسلسل هو أهم فرق بين كل من ال 1120 المكون من ١5‏ رقمًا المستخدم اليوم وبين 5671127 الذي 
يتضمن علامة 11:17. فمع 11205: يمكن للشركات تحديد عائلة المنتج التي تنتمي إليها الحالة (مثل, 
مناديل کارمن ۸ - عبوات)» ولكن لا يمكن تمييز عبوة واحدة من أخرى. أما مع 5671121 فيتم تحديد 
كل قطعة بشكل فريدء وهذا يوفر مستوى رؤية على مستوى القطعة: بدلا من مستوى عائلة المنتج. 
s 001100000111010000000001011100111110000101001101‏ 
1000 101011001010001 11001 1101 11001101010000000001 


الرقم المسلسل المنتج الصانع 
فحص الرقم ج77سخحبو صي 


^e 
(SGTIN) ODOSEOC 0 ug (RFID J bsla oai) 
EORR 3 0023800 | 41813 3 


شکل ۲-۸: علامة بیانات R۴15‏ 

ويعد أحد تطبيقات الكميات الضخمة من البيانات المتولدة عن طریق ۸۴1۲ في إدارة سلاسل 
التوريد (2007 ,52103 :8 ,11310813576 ,1061617). کما تستطیع الشرکات استخدام ۸۴1۲ لتحسین 
كفاءة أو فعالية العمليات الحالية المتنوعة عن طريق التغيير التدريجي للعملية. فعلى سبيل المثال» 
اقترحت الأدلة الأولية إمكانية تخفيض وقت استلام ا منتج في المستودع باستخدام (2006 )K42,‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري "Y‏ 





الفصل الثامن 


85810. فبدلًا من عمل مسح ضوي لكل قطعة من المنتج على انفراد باستخدام ماسح الباركود, 
يمكن قراءة المنتج ذي علامة ll RFID‏ على بوابة استلام المنتجات. وقدمت شركة جيليت تقريرًا 
بانخفاض وقت استلام لوحات التنزيل في مركز التوزيع الخاص بها من ٠١‏ ثانية إلى 0 ثوانٍ بفضل 
2810 وإستراتيجية علامة - على - المصدر التابعة لها (12,2006ة>1). و تتغير عملية الاستلام 
جذريًا (أي إن الرافعات الشوكية قامت بتفريغ المنتج كما كان من قبل). وكان التغيير الوحيد هو 
إزالة الحاجة للمسح اليدوي للمنتج. وبالتاليء أصبحت العملية أكثر كفاءة. كما يمكن زيادة فعالية 
العمليات. فمثله وجدت شركة ۷1-13۲ انخفاصًا بنسبة 2۲١‏ في المخزون باستخدام بيانات 
09 لتولید قوائم أفضل للمنتجات التي سيتم تجديدl)& Hardgrave, Langford, Waller,‏ 
(Miller, 8‏ إذ لم تتغير عملية تجديد الرف. ولكن تم تحسينها باستخدام ۸۴1. كما يستخدم 
09D‏ لتقليل عدد الأخطاء» مما يحسن دقة المخزونء ويؤدي في النهاية إلى تحسين التنبؤ والتجديد. 

وقد تم استخدام بیانات ۸۴1۲ في العديد من التطبيقات المرتبطة الأخرى. فعلى سبيل المثال» 
تمثل البضائع القابلة للتلف أحد التحديات الكبرى لإدارة سلسلة التوريد بسبب العدد الكبير من 
المتغيرات ذات الخصائص المختلفة القابلة للتلف. ومتطلبات حساب تدفق البضائع في بعض 
سلاسل التوريد. وكميات كبيرة من البضائع التي يتم تداولها على مسافات طويلة. وعلى الرغم 
من أن الطعام يمثل الجزء الرئيس من قائمة المنتجات القابلة للتلفء إلا أن العديد من المنتجات 
الأخرىء كالزهور الحديثة والأدوية ومستحضرات التجميل وقطع غيار السيارات» وغيرهاء تتطلب 
ضوابط بيئية صارمة للإبقاء على جودتها. ونظرًا لأن حجم البضائع اللمتداولة كبير جدًاء فتزداد 
احتمالية حدوث المشاكل )2007 .(Sahin, Babai, & Dallery Vaillant,‏ كما يزيد القضاء على 
نسبة صغيرة من التلف ga Hia‏ معنوية التحسن في سلاسل التوريد. ولذلك' تكون للإدارة المثلى 
لسلاسل توريد البضائع القابلة للتلف أهمية كبرى للشركات في هذا القطاع السوقي. 

يعتمد نجاح سلاسل التوريد سريعة الزوال اليوم على مستوى (وتوقيت) بروز المنتج. وينبغي 
أن يجيب هذا الظهور على أسئلة «أين المنتج الخاص بي؟» و«ما هو شرط المنتج الخاص بي؟». 
وبالفعل» شرعت العديد من الشركات في تجربة استخدام ۸۴12 للمواد القابلة للتلف» مع الوضع 
في الاعتبار كلا من الأمثلة التالية: 
- قامت شركة ساموورث برذارز ISTA) g5s:U (Samworth Brothers)‏ المتحدة؛ سندويشات 

وحلويات» إلخ) بإجراء مراقبة فورية لدرجة الحرارة في شاحناتها (20062 مهنع 57»0). 


- تقوم ستاربكس باستخدام تتبع درجات الحرارة لمنتجات إعداد الطعام المتجهة إلى منافذ بيع 
(Swedberg, 2006b) 5;2-Jl‏ 


"E‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


- تقوم ٥٥ر5‏ باستخدام ۸۴1۲ لفحص شروط التنزيل دون فتح الأبواب (2005 ,مستلاهك). 

ولنا في إدارة جودة المنتج مثال آخر على استخدام 21517 في سلاسل التوريد. فقد كشفت 
الدراسات التي تستخدم علامات 1115 القائمة على أجهزة الاستشعار في الشاحنات المزودة 
بمبردات والمخصصة لحمل ال مواد الغذائية أن درجة الحرارة فيها لم تكن ثابتة كما هو مفترض» 
بل تفاوتت بشكل كبير (2011 ,552108 & (Delen, Hardgrave,‏ فقد تتغير البيئة مع انتقال 
المنتج عبر سلسلة التوريد وهذا يؤثر على جودة وسلامة ال منتج. وهنا يأ دور أجهزة الاستشعار 
البيئية التي تدعم '۸۴12 إذ توفر رؤية للظروف البيئية ا متغيرة ا محيطة با منتج كما توفر البيانات 
اللازمة لتحديد مدى تأثير تلك التغييرات على جودة أو سلامة المنتج. وبدون أجهزة استشعار 
يمكننا الحصول على تقديرات متنوعة للظروف البيئية ولكن عند نقطة واحدة فقط دون أي رؤية 
ما بين تلك النقاط (على سبيل المثال» درجة الحرارة في وقت التنزيل» وي وقت التسليم). وف 
تطبيقات العينة. تختلف درجات الحرارة وفقًا لأشياء معينة: منها: 
- الموقع على لوح التنزيل (في الأعلىء في المتتصفء في الأسفل). 
- ترتيب التنزيل (أي موقع لوحات التنزيل). 
- نوع الحاوية. 
- نوع المنتج. 
- مواد التغليف (صندوق مموج أو بلاستيك مقوى). 

ويقترح الأثر الملحوظ للعديد من المتغيرات ضرورة مراقبة البيئة بشكل مستمر لتحقيق الفهم 
التام للظروف المحيطة على مستوى لوح التنزيل و / أو القطعة. وبشكل عام» فإن أجهزة استشعار 
(درجة الحرارة) الممكنة بتقنية RFID‏ تعمل جيدًا وتوفر رؤية واسعة لا يمكن الحصول عليها 
بتقديرات النقطة الواحدة للظروف التي تواجه المنتج عند مروره عبر سلاسل التوريد. والدرس 
المستفاد بشكل عام هو أن تقنية 11:17 تولد كميات ضخمة من البيانات التي يمكن تحليلها للحصول 
على أفكار عظيمة بشأن بيئة الشركة» وهذا هو الغرض الرئيس لقيام ذكاء الأعمال ودعم القرار. 
الحوسبة الضبابية: 

تعد إحدى أهم القضايا في إنترنت الأشياء هي أن البيانات التي تنتجها أجهزة الاستشعار بيانات 
ضخفة: ولكن ليست كلها مفيدة. D)‏ ماهو القدر الواجب رفعه من البيانات الضخمة على 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 140 


الفصل الثامن 


الخوادم السحابية لتحليلها؟ وتعتبر فكرة الحوسبة الضبابية هي المفهوم الجديد لحل هذا السؤال؛ 
حيث يقوم الضباب بتمديد السحابة لتكون أقرب إلى الأشياء التي تنتج وتعمل على بيانات إنترنت 
الأشياء. ويمكن وضع هذه الأجهزة. والتي يطلق عليها عقد الضباب» في أي مكان بين ربط الشبكة. 
ويمكن لأي جهاز يتوفر له الحوسبة والتخزين والاتصال بالشبكة أن يكون عقدة ضباب» كأجهزة 
الراوتر أو المحولات. وفيما يلي توضيح لذلك: 

مركز البيانات / السحابة > جهاز الضباب > جهاز مادي / أجهزة استشعار لتوليد البيانات 

يؤدي تحليل البيانات بالقرب من الأجهزة إلى تقليل وقت الاستجابة. كما يحافظ أيضًا على 
السعة التنزيلية» إذ إن إرسال البيانات إلى السحابة يتطلب سعة تحميلية كبيرة. وتزداد أهمية 
الحوسبة الضبابية عندما تحتاج البيانات للتحليل في أقل من ثانية» كما هو الحال في حالة عطل 

جدول 1-۸: الفرق بين عقد الضباب ومنصة السحاب 
عقد الضباب منصة السحابة 

تستقبل البيانات من أجهزة إنترنت الأشياء. تستقبل وتجمع البيانات من عقد الضباب. 
تقوم بتنفيذ تحليلات إنترنت الأشياء في وقت | يتم إجراء التحليل على كميات ضخمة من بيانات 
الاستجابة بامللي ثانية. الأعمال والذي قد يستغرق ساعات أو أسابيع. 








كما قد تعطي الحوسبة الضبابية مزيدًا من الأمان. حيث يمكن تأمين عقد الضباب باستخدام 
نفس حل الأمان المستخدم في بيئات تقنية المعلومات الأخرى. 
منصات إنترنت الأشياء: 

ولأن إنترنت الأشياء لا يزال قيد التطويرء فإن العديد من منصات التقنية الخاصة با مجال والتطبيقات 
تتطور أيصًا. وليست مفاجأة أن يكون العديد من ا موردين الأساسيين لأنظمة إنترنت الأشياء هم نفس 
ا موردين الذين يوفرون خدمات تحليل ومستودعات البيانات ممجالات التطبيق الأخرى؛ والتي منها: 
.Amazon AWS IoT -‏ 
„Microsoft Azure IoT Suite -‏ 
.Predix IoT Platform by General Electric (GE) -‏ 
- حلول '101 .IBM Watson‏ 
-Teradata Unified Data Architecture -‏ 


uw‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 

















الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


وقد عرضنا مثالًا على ذلك في المقالة الافتتاحية القسم .١-8‏ كما تقدم حالة عملية ١-8‏ تطبيقًا 
من منصة رئيسة أخرى لإنترنت الأشياء والتي تقوم بتسويقها جنرال إلكتريك. 
حالة عملية 1-8 
التعاون المشترك بين بيتني باوز 80155 (]21 ومنصة جدرال إلكتريك [2:عمء © 
Electric 1T‏ لتحسين الإنتاج 

laag Pitney Bowes yis‏ الرئيس في ولاية كونيتيكت Connecticut‏ هي 
المورد الأمريي لحلول التجارة الإلكترونية ومنتجات الشحن والبريد. تقوم آلات الشركة 
بتشغيل أو إنتاج بمعدل 10١‏ مليون قطعة بريد ف اليوم. ويقوم 1ن Enterprise‏ 
g9 xohi Pitney Bowes J zjiJI Business‏ وخدمة آلات 84$ 4545( -Inserters‏ 
تساعد هذه الآلات البنوك ومقدمي الرعاية الصحية على وضع قطعة البريد الصحيحة 
في المظروف ذي المقاس الصحيح. بالنسبة لبنك واحدء قامت هذه الآلة بتجميع 1٠١‏ 
مليون قطعة بريد في السنة. وتنتج معظم الآلات رسالة في الساعة. وبهذا 
المستوى من الإنتاج الآلي تقوم 801065 '(21]06 وعملاؤها أيضًا بإنتاج كمية ضخمة 
من البيانات كل 4e: Pitney Bowes „aug eg‏ البيانات المتولدة من آلات 
البريد هذه للتنب بأعطال الآلات مقدمًا ومن ثم منع أي انقطاع للخدمة وإصلاح الآلات 
قبل أن تتعطل. وقد اعتمدت Predix Pitney Bowes‏ 61: كمنصة سحابة مصممة 
للإنترنت الصناعي؛ إذ تقوم منصة 2:01 بتحليل بيانات جهاز الاستشعار للآلات 
وباستخدام التحليلات الفورية: تقدم أفكارًا قوية تسهل اتخاذ القرارات. وبالإضافة إلى 
منع انقطاع الخدمة. تساعد التحليلات المقدمة من 2:01 على تقليل وقت العطل 
وبالتالي زيادة الإنتاجية. وقد أدى التحليل الشامل لبيانات جهاز الاستشعار الذي 
تجريه JJ] Predix‏ 6305 الإنتاجية وتحسين أداء الآلات. 
Sources: News.pb.com. (2015). GE and Pitney Bowes join forces to bring the power‏ 
of the industrial Internet to the world of commerce. http://news.pb.com/article display.‏ 
cfm?article id—5634 (accessed August 2016); GEreports.com. (2016). The power of Predix:‏ 
An inside look at how Pitney Bowes is using the industrial Internet platform. http://‏ 
www.gereports.com/the-power-of-predixan-inside-look-at-how-pitney-bowes-has-‏ 
been-using-the-industrialinternet-platform/; (accessed August 2016); GE.com (2016).‏ 


Making machines intelligent is smart business. http://www.ge.com/digital/sites/default/ 
files/ge digital predix pb brochure.pdf; (accessed August 2016); GE.com. (2015). The 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري aav‏ 


الفصل الثامن 


industrial Internet, Pitney Bowes and GE. http://blogs.pb.com/corporate/201514/07//the 
industrialinternet-pitney-bowes-and-ge/(accessed August 2016). 


بدء النظام البيئي لإنترنت الأشياء: 


تشرع العديد من الشركات المبتدئة في الظهور في مجال إنترنت الأشياءء. وفي غضون ثلاث إلى 
أربع سنوات قادمة سنرى ازدهارًا كبيرَا في صناعة إنترنت الأشياء. وقد نما رأس المال ا مطروح في 
مشهد إنترنت الأشياءء من ۱,۸ بلیون دولار فی عام ۲۰۱۳ إلی ۲,۵۹ بلیون دولار فی عام 27015 ثم 
إلى ۴,٤٤‏ بليون دولار في عام .٠010‏ ولعل من أبرز الأمثلة على الشركات الناشئة في إنترنت الأشياء: 
FreedomPops Jawbones Greenwaves Athoss Canarys 3D Roboticss Sigfox‏ 3 
-Rings Razer‏ 

وتعد 116016 من أنجح شركات إنترنت الأشياء» وهي شركة أمريكية تقوم بتصنيع متتبعات 
النشاطء وأجهزة تقنية لاسلكية تستخدم أجهزة استشعار لتحديد عدد خطوات المشيء ومعدل 
القلب» وجودة النوم» وخطوات التسلق» وغيرها من مقاييس الصحة الشخصية. 

كما تقوم شركات الاتصالات أيضًا باستكشاف وترويج إنترنت الأشياء. ويسعى معظم كبار 
المشتغلين بالاتصالات مثل ۸18١‏ إلى الاستفادة من هذه التقنية. ولتوفير الاتصال بالسيارات» 
أبرمت ۸۲81 شراكة مع ۸ شركات أمريكية لتصنيع السيارات من أصل ٠١‏ شركات تعمل في هذا 
المجال. وتعرض العديد من شركات الاتصالات شبكات الجيل الخامس القادمة الخاصة بها كحجر 
أساس لإنترنت الأشياء. 

يعتبر كل من 2066دام60081/41 و4123202 هما الأبرز في النظام البيئي لإنترنت الأشياء. 
كما تعد 0081© بسحابة 600816 التابعة لهاء و5وط2:]آ 51061817011 (مدن ذكية) والسيارات ذاتية 
القيادة مستثمرًا رائدًا في العديد من مبادرات إنترنت الأشياء. وقد أنتجت 412320 باستخدام 
خدمات الويب أمازون (81175) التابعة لها منصة جديدة لإنترنت الأشياء والتي يمكن أن تعمل 
كخلفية لإنترنت الأشياء. ويقدم الشكل (8-”) عرضًا موجرًا لمكونات النظام البيئي لإنترنت 
الأشياء. والذي يشتمل على مجالات التطبيق اممختلفةء وصانعي الأجهزةء ومقدمي خدمة الاتصال 
ومطوري البرمجيات» ومستشاري التحليلات» وما إلى ذلك» وهو مقتبس من مخطط النظام البيئي 
الذي تم تطويره وصيانته على المدونة: http://mattturck.com/2016/03/28/2016-iot-‏ 
/عم1320562 من قبَل صاحبها عك11' 2/26 (تمت الزيارة في أغسطس .)۲۰۱١‏ 


MA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 











Sources: Adapted from matt, T(March, 2016). Internet of Things: Are We There Yet? 
http://mattturck.com/2016/03/28/2016-iot-landscape/ (accessed August 2016) . 


ell :Y-A ss‏ البيئي لإنترنت الأشياء 

يتضمن هذا المخطط المفصل قائمة لشركات في كل مجموعة. ويبين الشكل (8-") أن فرص إنترنت 
الأشياء تتطور في ثلاثة قطاعات رئيسة؛ إذ تشتمل المجموعة الأولى على الشركات التي توفر مجموعات 
بناء تقنيات وأدوات تمكين إنترنت الأشياء (الأجهزة والبرمجيات والاتصال واللمستشارين / الحاضنات / 
التحالفات / الشركاء). وتشمل المجموعة الثانية المنصات والواجهات والطباعة ثلاثية الأبعاد الحديثة 
وموردي التقنية / الخدمة المتحدين: ويمكننا أن نطلق على هذه المجموعة اسم (موردو الخدمة للمطوري 
إنترنت الأشياء - قطاع أفقي). في حين تتألف المجموعة الثالثة من قطاعات الصناعة» وهي المنطقة التي 
ستكون إلى حد كبير تطبيقات في قطاعات مختلفة» وهي القطاع الشخصي والمنزل والمركبات والمؤسسات 
والإنترنت الصناعيء حيث يقدم الشكل (1-”) صورة واحدة لهذه المنظمة» بينما يتضمن موقع المدونة 

صورة مختلفة تتضمن أمثلة لشركات في كل من المجموعات الفرعية المحددة هناء 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري MS‏ 








الفصل الثامن 


اعتبارات إدارية فى إنترنت الأشياء: 


على الرغم من الإثارة الضخمة الدائرة حول نمو وإمكانية إنترنت الأشياءء إلا أن هناك بعض 

القلتى الذي ينبغي على المديرين الإلمام به. وقد جمع معهد ماكنزي «IJI (McKinsey)‏ 

Xs (Y-Y0)‏ تنفيذيًا ممتارًا لإنترنت الأشياء. 
ويحدد هذا التقرير القضايا التالية: 

-١‏ التوافق التنظيمي: على الرغم من صحة ذلك بالنسبة للكثير من مبادرات التقنية الأخرى» فمع 
إنترنت الأشياءء فإن فرص التحسينات التشغيلية وإيجاد فرص أعمال جديدة تعني أنه يجب على 
موظفي تقنية المعلومات وموظفي التشغيل أن يعملوا كفريق واحد وليس في وظائف منفصلة. 
وكما لاحظ مؤلفو الدليلء «فإن إنترنت الأشياء سوف يتحدى المفاهيم الأخرى للمسؤوليات 
التنظيمية. كما ينبغي على مديري أقساه المالية والتسويق والتشغيلء بجانب قادة وحدات 
«Jas‏ أن يكونوا متقبلين (McKinsey, 2015) «eazalisl 1a» jJ‏ 


؟- تحديات العمل المشترك: يشكل العمل المشترك ضررًا كبيرَا حتى الآن في نمو هذه الأنظمة؛ إذ 
لا تتصل جميع الأجهزة مع بعضها البعض بسلاسة. ثانيّاه هناك الكثير من المشاكل التقنية 
في الاتصالء ولا تملك العديد من المناطق النائية اتصالات 1171-51 مناسبة بعدء وأيضًا تكون 
القضايا المتعلقة بمعالجة البيانات الضخمة مسؤولة عن التقدم البطيء في إنترنت الأشياء. 
وتحاول الشركات تقليل البيانات على مستوى جهاز الاستشعار بحيث يتم تمرير الحد الأدنى 
فقط من البيانات إلى السحابةء مما يجعل دعم البنية التحتية الحالية للكمية الضخمة من 
البيانات المتولدة من إنترنت الأشياء ellas L sl‏ مشكلة ذات صلة أخرى وهي تزويد 
الأجهزة بأجهزة استشعار لتكون قادرة على جمع ونقل البيانات للتحليل» ويستغرق الأمر 
في المتوسط من 18 إلى ١6‏ شهرًا لتبدأ إنترنت الأشياء بشحن منتجهاء ثم من سنة إلى سنتين 
إضافيتين لتوزيع وبيع منتجها في السوق. وبالإضافة إلى ذلك سيستغرق ا مستهلكون وقنًا 
لاستبدال الأشياء المتناظرة بمنتجات ذكية جديدة من إنترنت الأشياء. وكمثال: فإنه بالنسبة 
للناس يعد استبدال الهواتف الجوالة أسهل من استبدال السيارة وأدوات المطبخ والأقفال 
وأشياء أخرى يمكن أن تستفيد من وجود جهاز استشعار وبقائه متصلًا مع إنترنت الأشياء. 

Source: Cisco.com. (2015). Fog computing and the Internet of Things: Extend the Cloud to where the 


things are.  https://www.cisco.com/c/dam/en us/solutions/trends/iot/docs/computing-overview.pdf 
(accessed August 2016). 


ve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


“- الأمان: يمثل أمن البيانات قضية عامة: ولكنها في سياق إنترنت الأشياء تعتبر قضية أكبر؛ إذ 
يصبح كل جهاز متصل ب إنترنت الأشياء نقطة دخول أخرى للقراصنة الأشرار للوصول إلى نظام 
كبيرء أو على الأقل تشغيل أو إتلاف الجهاز المحدد. فهناك قصص لقراصنة قادرين على الاختراق 
والتحكم في الوظائف الآلية للسيارة أو السيطرة على فتح باب الجراج عن بعد. وتتطلب مثل 
هذه القضايا أن ينطوي أي اعتماد واسع النطاق لإنترنت الأشياء على اعتبارات أمنية منذ البداية. 
وعلى الرغم من هذه الاعتبارات الإدارية» إلا أن النمو الناشئ في إنترنت الأشياء وإمكانياته 

لمساعدتنا في تحقيق الرؤية للمدن الذكية وللشبكة الذكية ولأي شيء ذي يعد أمرًا محيرًا. فهي 

إحدى المجالات المفتوحة الشاسعة للإبداع وريادة الأعمال. 

أسئلة مراجعة على القسم 7-8: 

-١‏ ما هي استخدامات إنترنت الأشياء الأساسية؟ 

۲- ما هي مجموعات البناء التقنية في إنترنت الأشياء؟ 

SRFID ça l -Y 

-٤‏ إبحث على الإنترنت عن تطبيقات ۸۴10 ف الرعاية الصحية والترفيه والرياضة. 

-٥‏ حدد بعض أهم العاملين في النظام البيئي لإنترنت الأشياءء واستكشف عروضهم. 

1- اذكر بعض القضايا الرئيسة التي ينبغي على المديرين إدراكها عند استكشاف إنترنت الأشياء؟ 

۸ الحوسبة السحابية وتحليلات الأعمال: 
يوجد اتجاه تقني حديث الظهور ينبغي على مستخدمي تحليلات الأعمال الإلمام به وهو 

الحوسبة السحابية. ويعرّف ال معهد الوطني للمعايير والتقنية (۸181) الحوسبة السحابية على 

أنها: «نموذج لتمكين الوصول إلى الشبكة ال مناسبة عند الطلب إلى مجموعة مشتركة من موارد 

الحوسبة القابلة للتشكيل (كالشبكات والخوادم والتخزين والخدمات) والتي يمكن توفيرها 

وإصدارها بسرعة وبأقل جهد إداري أو تفاعل من مورد الخدمة»» في حين تُعرّف ويكيبيديا (,.2.4 

iolu)! iwga (Cloud Computing‏ تعريقًا فضفاصًا وشاملًا وهو: ”أسلوب حوسبة يتم 

من خلاله توفير الموارد القابلة للتطوير بشكل ديناميكي وغالبًا ما تكون افتراضية ويتم توفيرها 

عبر الإنترنت» ولا يحتاج المستخدمون إلى معرفة أو خبرة في أو التحكم في البنى التحتية للتقنية 

في السحابة التي تدعمهم“. ومن ناحية أخرى: تعد الحوسبة السحابية اسمًا جديدًا للعديد 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۷۰1 


الفصل الثامن 


من الاتجاهات السابقة ذات الصلة» كحوسبة المرافق» وحوسبة شبكة مقدم خدمات التطبيق» 
والحوسبة عند الطلبء والبرمجيات كخدمة (848)» وحتى الحوسبة ال مركزية القدهة باستخدام 
المحطات الصامتة. غير أن مصطلح الحوسبة السحابية ينتج أصلًا من إشارة إلى الإنترنت باعتباره 
«سحابة» ويمثل تطورًا في جميع اتجاهات الحوس بة المشتركة / المركزية السابقة. ويعرف القائم 
بالإدخال في ويكيبيديا أيضًا أن الحوسبة السحابية هي مزيج من عدة مكونات لتقنية المعلومات 
كخدمات. فعلى سبيل المثال» تشير البنية الأساسية كخدمة (1885) إلى توفير منصات الحوسبة 
«(PaaS) à Saas‏ بالإضافة إلى توفير منصة أساسية. مثل إدارة الحكومة» والأمان: وما إلى «US‏ 
وتتضمن أيضًا 5325 والتي تشتمل على تطبيقات يتم نقلها من خلال متصفح ويبء في حين تكون 
البيانات وبرامج التطبيقات موجودة على خادم آخر. 

بالرغم من أننا عادةً لا ننظر إلى البريد الإلكتروني على الويب كمثال للحوسبة السحابية» إلا أنه 
يمكن اعتباره تطبيقًا سحابيًا أساسيًا. وعادةً ما يقوم تطبيق البريد الإلكتروني بمستودعات البيانات 
(رسائل البريد الإلكتروني) والبرمجيات (برامج البريد الإلكتروني التي تسمح لنا بمعالجة وإدارة 
رسائل البريد الإلكتروني). ويوفر مزود البريد الإلكتروني أيضًا الأجهزة / البرامج والبنية الأساسية 
بالكامل. وطابما ظل الإنترنت متاحًاء يكون الوصول إلى تطبيق البريد الإلكتروني من أي مكان 
في السحابة ممكتًا. وعندما يتم تحديث التطبيق من قبل مزود البريد الإلكتروني a)‏ عندما 
يقوم 61311 بتحديث تطبيق البريد الإلكتروني الخاص 45( فإنه يصبح متاحًا لجميع العملاء 
دون حاجتهم لتنزيل أي برامج جديدة. ومن أمثلة الحوسبة السحابية أيضًا مواقع الشبكات 
Twitters Facebook Js «5 Jl ue às ze VI‏ و01ع101]. وبالتالي» يعتبر أي تطبيق عام 
على الويب مثالا على تطبيق سحاي. وهناك مثال آخر على تطبيق السحابة العامة وهو وثائق 
وجداول البيانات من »60081؛ حيث يسمح هذا التطبيق للمستخدم بإنشاء وثائق نصية أو 
جداول بيانات والتي يتم 523 Google esls 7 (de la‏ وتكون متاحة للمستخدمين من أي 
مكان يمكنهم الوصول إلى الإنترنت فيه. ومرةً أخرىء لا يحتاج المستخدم تثبيت أي برامج باسم 
«التطبيق في السحابة». كما أن مساحة التخزين موجودة أيضًا «في السحابة». 

وهناك مثال جيد على الأعمال العامة للحوسبة السحابية وهو خدمات الويب الخاصة بشركة 
dzos iu pgh Amazon.com Cl ¿u> ‘Amazon.com‏ تقنية مذهلة لكل من التجارة 
الإلكترونية وذكاء الأعمال وإدارة علاقات العملاء وإدارة سلاسل التوريدء كما قامت بإنشاء مراكز 
بيانات رئيسة لإدارة عملياتها الخاصة. ومع ذلكء ومن خلال الخدمات السحابية في Amazon.‏ 
com‏ يمكن للعديد من الشركات الأخرى استخدام نفس هذه التسهيلات للحصول على مزايا 


vey‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


هذه التقنيات دون القيام باستثمار مماثل. وكما هو الحال في خدمات الحوسبة السحابية 
الأخرىء يستطيع المستخدم أن يشترك في أي من التسهيلات على أساس: ادفع - كما - تذهب 
go)‏ ا0ر وه ره۴). ويعد هذا النموذج من السماح لشخص آخر بامتلاك الأجهزة والبرمجيات 
مع صنع استخدام التسهيلات على أساس الدفع - لكل - استخدامًا بمثابة حجر الزاوية في الحوسبة 
السحابية. ويوفر عدد من الشركات خدمات الحوسبة السحابيةء مثل IBM)s Salesforce.com‏ 
Googles (Microsoft Azure)s (Bluemix‏ 553 

وكما هو الحال في العديد من اتجاهات تقنية المعلومات الأخرى فقد أنتجت الحوسبة 
السحابية عروضًا جديدةً في ذكاء الأعمال؛ حيث تسمح هذه الخيارات للمنظمة بتطوير مستودع 
بياناتها والدفع فقط نظير ما تستخدمه بالفعل. وقد يستخدم المستخدم النهائي لخدمة ذكاء 
الأعمال القائمة على السحابة منظمة واحدة لتطبيقات التحليل والتي تستخدم في المقابل شركة 
أخرى للمنصة أو للبنية التحتية. وتلخص المقاطع المتعددة التالية أحدث الاتجاهات في واجهة 
الحوسبة السحابية وذكاء الأعمال / تحليلات الأعمال )2013 .(Demirkan & Delen,‏ 

ويوضح الشكل )٤-۸(‏ بنية مفاهيمية لبيئة دعم القرار الموجهة بالخدماتء والتي تعتبر نظام 
تحليلات قائم على السحابة. وفي هذا الشكل يتم دمج الخدمات القائمة على السحابة مع بنية 
التحليلات العامة المقدمة في الفصول السابقة. 
إدارة السليات إدارة المملومات 


لھ اسر 


ua ui cii 


إدارة البيانات 





المحاكاة 


0 انظام القرارات 
A‏ 


acu p 


Sources: Based on Demirkan,H.,& Delen,D (April, 2013)Ievergingcapabilitiesof-orienteddecision 
support systtems: putting analytics and big data in cloud. decision support Systtems.55(1).412-421. 

















شكل 6-8: بنية مفاهيمية لنظام دعم سحابي 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vY‏ 














الفصل الثامن 


وفي حلول دعم القرار الموجهة بالخدماتء يمكن الحصول على العناصر التالية ds‏ على حدة 
أو مجتمعة وتقدهها للمستخدمين كخدمة» وهذه العناصر هي: 


-١‏ أنظمة التشغيل. 
۲- مستودعات البيانات. 
*- المعالجة التحليلية الفورية. 
ع- مكونات المستخدم النهائي. 

ويمكن الحصول على إحدى أو كل هذه الخدمات من خلال السحابة. ولأن مجال الحوسبة 
السحابية يتطور سريعًا وينمو بإيقاع متسارع. فقد نتج عن ذلك التباس كبير في المصطلحات 
المستخدمة من جانب مختلف الموردين والمستخدمينء فتختلف المسميات من حيث البنية الأساسية 
والمنصة والبرمجيات والبيانات والمعلومات والتحليلات كخدمة. ونعرّف فيما يلي هذه الخدمات» 
ثم نلخص المنصات التقنية الحالية ونسلط الضوء على تطبيقات لكل منها من خلال حالات عملية. 
البيانات كخدمة :(DaaS)‏ 

يدافع مفهوم البيانات كخدمة بشكل أساسي عن وجهة النظر التي تقول: «أين تعيش 
ez Y cuo «DUI‏ المنصة الفعلية بمكان إقامة البيانات. فقد تتواجد البيانات في جهاز 
حاسب محلي أو في خادم في مزرعة خوادم داخل بيئة الحوسبة السحابية. ومع 048 هكن لأي 
عملية أعمال الوصول إلى البيانات أينما وجدت. بدأت البيانات كخدمة بفكرة أن جودة البيانات 
تحدث في مكان مركزيء وتطهير وإثراء البيانات وعرضها على أنظمة أو تطبيقات أو مستخدمين 
مختلفين» بغض النظر عن مكان وجود تلك البيانات سوء في المنظمة» أو على أجهزة الحاسب» 
أو على الشبكة. والآنء تم استبدال هذا بإدارة البيانات الأساسية وحلول تكامل بيانات العملاء 
حيث يمكن أن تتواجد سجلات العملاء (أو المنتجات» أو الأصولء إلخ) فق أي مكانء وتكون متاحة 
كخدمة لأي تطبيق به خدمات تسمح بالوصول إليها. ومن خلال تطبيق مجموعة قياسية من 
التحويلات على المصادر المتنوعة للبيانات (كأن يتم التأكد من أن الحقول الخاصة بالجنس والتي 
تحتوي على اط رمزية مختلفة [مثلء 1/۸۷5 ][M/۴‏ تتم ترجمتھا جمیعًا إلى ذكر / أنثى) ثم 
تمكين التطبيقات من الوصول إلى البيانات عبر واجهات مفتوحة مثJل SQL‏ وXQuery‏ وXM1L‏ 
بحيث هكن لطالبي الخدمات الوصول إلى البيانات دون الحاجة إلى ا مورد أو النظام. 


ve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


وباستخدام 08ء يستطيع العملاء الانتقال بسرعة وذلك لسهولة الوصول إلى البيانات وحقيقة 
أنهم ليسو بحاجة إلى معرفة شاملة بالبيانات الأساسية. فإذا طلب العملاء بنية بيانات مختلفة إلى 
حد ما أو متطلبات خاصة با موقع» تكون الاستجابة لهم سهلة لأن التغييرات تكون عند أدنى حد لها 
(رشيقة). ثانيّاه يستطيع مقدمو الخدمة بناء القاعدة بالاستعانة بخبراء البيانات ومصادر خارجية 
لطبقات التحليل أو التقديم (والتي تتيح للمستخدم واجهات فعالة جدًّا من حيث التكلفة كما 
تجعل طلبات التغيير في طبقة التقديم أكثر جدوى)» ويتم التحكم في الوصول إلى البيانات من خلال 
خدمات البيانات» ويتجه إلى تحسين جودة البيانات لأن هناك نقطة واحدة للتحديثات. 
البرمجيات :(SaaS) douss‏ 

يتيح هذا النموذج للمستهلكين استخدام التطبيقات والبرامج التي يتم تشغيلها على أجهزة 
الحاسب البعيدة في البنية التحتية للسحابة. ولا يحتاج المستهلكون أن يهتموا بإدارة البنية 
التحتية للسحابة؛ فيجب عليهم الدفع مقابل استخدام البرمجيات فقط. وكل ما نحتاج إليه هو 
متصفح ويب للاتصال بالسحابة. وتقدّر شركة جارتنر أن إيرادات 5385 في عام ٠١10‏ حوالي 7١‏ 
مليار دولار K‏ وتستخدم في ۷۷ من جميع المنظمات. وتعتبر كل من Picasas Gmail‏ 5 
SaaS le ål Flickr‏ 
المنصة كخدمة :(PaaS)‏ 

وباستخدام هذا النموذج» تستطيع الشركات نشر البرمجيات والتطبيقات الخاصة بها في السحابة 
بحيث يمكن استخدامها من قبل العملاء. ولا يتعين على الشركات إدارة الموارد المطلوبة لإدارة 
تطبيقاتها في شبكات تشبه السحابة أو الخوادم أو التخزين أو أنظمة التشغيل؛ وهذا يقلل من تكلفة 
صيانة البنية التحتية الأماسية لتشغيل برامجهم كما يوفر أيضًَا وقت إعداد هذه البنية التحتية. 
والآن» يستطيع المستخدمون التركيز فقط على أعمالهم دون التركيز على إدارة البنية التحتية لتشغيل 
برامجهم. ومن الأمثلة على 2385: -Google App Engines Amazon EC25 Microsoft Azure‏ 
البنية التحتية كخدمة :(laaS)‏ 

في هذا النموذج» يتم توفير موارد البنية التحتية كالشبكات والتخزين والخوادم وموارد 
الحوسبة الأخرى لشركات العملاء؛ إذ يستطيع العملاء تشغيل تطبيقاتهم والحصول على حقوق 
إدارية لاستخدام هذه الموارد ولكنهم لا يديرون البنية التحتية الأساسية. ويجب على العملاء 
الدفع مقابل استخدام البنية التحتية. وخير مثال على ذلك هو خدمات الويب $ Amazon.‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۷.0 


الفصل الثامن 


2-. فقد طورت 4123202.62022 بنية تحتية تقنية رائعة تتضمن مراكز بيانات. بحيث يمكن 
للشركات الأخرى استخدام خدمات السحابة التابعة ل 47232202.6071 بنظام الدفع - لكل - 
استخدام دون الحاجة إلى عمل استثمارات مماثلة. 

يجب أن نلاحظ أن هناك الكثير من الالتباس والتداخل في استخدام مصطلح السحابة. فعلى 
سبيل المثالء يضيف بعض الموردين أيضًا المعلومات كخدمة «(TaaS)‏ والتي تعد امتدادًا ل -DaaS‏ 
ومن الواضح أن 1325 تختلف عن «البنية التحتية كخدمة» التي تم شرحها منذ قليل. ويكون هدفنا 
هنا هو التعرف فقط على وجود درجات متفاوتة من الخدمات التي يمكن لأي منظمة الاشتراك فيها 
لإدارة تطبيقات التحليلات. ويسلط الشكل (3-8) الضوء على مستوى الاشتراكات في الخدمة التي 
يستخدمها العميل في كل نوع من الثلاثة للعروض السحابية الرئيسة. ويتضح من الشكل أن 5285 
db‏ في المستوى الأعلى من الخدمة السحابية التي قد يحصل عليها العميل. فمثلًا. عند استخدام 
Office 365‏ تستخدم إحدى المنظمات البرمجيات كخدمة: ويكون العميل هو المسؤول الوحيد عن 
إحضار البيانات» وتقع العديد من التحليلات كتطبيق خدمة في هذه الفئة أيضًا. 




















p‏ | التطبيق 
البيانات البيانات 
Debra‏ وقت التشغيل وقت التشغيل 
E‏ 
تدار بواسطة مورد السحابة | Fd | rca‏ 
azar ais‏ .| نظام التشغيل 
mom‏ .| الإفتراضية 
الخوادم | الخوادم 
"e | axe‏ 
البرمجيات كخدمة المنصة كخدمة البنية التحتية كخدمة 
PaaS SaaS‏ 15 


شكل 0-8: حزمة التقنية كخدمة لأنواع مختلفة من عروض السحابة 
التقنيات الأساسية للحوسبة السحابية: 


الافتراضية: وهي إنشاء نسخة افتراضية لشيء يشبه نظام التشغيل أو الخادم. ومن الأمثلة 
البسيطة على الافتراضية هو التقسيم المنطقي لمشغل الأقراص الصلبة لإنشاء مشغلين منفصلين 


v‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 






































الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


للأقراص الصلبة في الحاسب. ويمكن للافتراضية أن توجد في جميع المجالات الثلاثة للحوسبة كما يلي: 

- افتراضية الشبكة: أي تقسيم السعة التنزيلية المتاحة إلى قنوات» وهذا يعمل على إخفاء تعقيد 
الشبكة بتقسيمها إلى أجزاء يمكن إدارتهاء ثم بعد ذلك يمكن تخصيص كل سعة تحميلية لخادم 
أو جهاز معين بشكل فوري. 

- افتراضية التخزين: هو تجميع التخزين االمادي من أجهزة تخزين شبكة متعددة إلى جهاز 
تخزين واحد يمكن إدارته من وحدة التحكم المركزية. 

- افتراضية الخادم: وهو إخفاء الخوادم المادية عن مستخدمي الخادم؛ ولا يتعين على ا مستخدمين 
إدارة الخوادم الفعلية أو فهم التفاصيل المعقدة لموارد الخادم. 

ويرتبط هذا الاختلاف في مستوى الافتراضية مباشرةً مع الخدمة السحابية ا مستخدمة. 
نماذج نشر السحابة: 
يمكن الحصول على الخدمات السحابية بعدة طرق. من بناء بنية تحتية خاصة بالكامل إلى 

المشاركة مع الآخرين. وتعد النماذج الثلاثة التالية هي الأكثر شيوعًا: 

- سحابة خاصة: ويطلق عليها أيضًا سحابة داخلية أو سحابة الشركات» وهي صورة للخدمة 
السحابية أكثر أمانًا Google BigQuerys MS Azure Js áalsJl «iJ s‏ ويتم تشغيلها 
فقط لمؤسسة واحدة ذات عبء عمل المهام الحاسمة والمخاوف الأمنية» وهي توفر نفس 
الفوائد كخدمة عامة شبيهة بالسحابة» والقابلية للتغييرء وتغيير موارد الحوسبة حسب الطلب» 
وما إلى ذلك. وتتمتع الشركات التي لديها سحابة خاصة بالتحكم المباشر على بياناتها وتطبيقاتها. 
وتكمن عيوب امتلاك سحابة خاصة في تكلفة صيانة وإدارة السحابة حيث يكون طاقم عمل 
تقنية المعلومات في الشركة هو المسؤول عن إدارتها. 

- سحابة عامة: وفي هذا النموذج» يستخدم المشترك الموارد المعروضة من جانب مقدمي الخدمة على 
الإنترنت» وتتم إدارة البنية التحتية للسحابة بواسطة مقدم الخدمة. وتتمثل الميزة الأساسية لنموذج 
السحابة العامة هذا في توفير وقت وتكلفة إعداد الأجهزة والبرامج المطلوبة لتنفيذ الأعمال. ومن 
أمثلة السحابة العامة منصة عتناتى „Amazon AWS Google App Engines Microsoft‏ 

- سحابة مختلطة: تمنح السحابة ا مختلطة الأعمال مرونة كبيرة بنقل أعباء العمل بين السحب 
الخاصة والعامة. فعلى سبيل المثالء تستطيع أي شركة أن تستخدم التخزين السحابي المختلط 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vv‏ 


الفصل الثامن 


لتخزين بيانات المبيعات والتسويق الخاصة بهاء ومن تم استخدام منصة سحابة عامة مثل 
Là Amazon Redshift‏ الاستعلامات التحليلية لتحليل بياناتها. ويعد المطلب الرئيس هو 
الاتصال الشبكي وتوافق ۸۲1 (واجهة برمجة التطبيقات) بين السحابتين الخاصة والعامة. 
كبار موردي منصة السحابة في التحليلات: 
نحدد في هذا القسم أولًا بعض المشغلين الأساسيين للسحابة التي توفر البنية الأساسية 
للتحليلات كخدمة» بالإضافة إلى وظائف التحليلات اممختارةء ثم نذكر أيضًا عروض التحليلات - 
كخدمة التمثيلية التي قد تعمل حتى على منصات السحابة هذه. 
Elastic Beanstalk‏ 0 وهي خدمة مقدمة من خدمات .Amazon c5‏ 25"( 
تستطيع نشر وإدارة وتطوير تطبيقات الويب وتدعم لغات البرمجة التالية: 1272[ وتإطناخآ1 و 
.II$5 Apache Tomcats Apache HTTP Js esl (je .NETs PHPs Python‏ 295 
على المستخدم تنزيل رمز التطبيق» ويقوم عللهائطه8 813512 بنشر التطبيقء وموازنة العب. 
والقياس التلقائي» ومراقبة صحة التطبيق. ولذا؛ يستطيع المستخدم التركيز على بناء مواقع الويب» 
وتطبيقات الجوال» وخلفية 41ء وأنظمة إدارة ا محتوى» و548 وما إلى ذلك في Elastic 55» xo‏ 
86815]11 على التطبيقات والبنية التحتية لإدارتها. كما يمكن للمستخدم استخدام خدمات ويب 
Eclipse Jis hlu pgh dtu 5| Amazon‏ أو o x) Visual Studio‏ تطبيقهم. ويجب Lil‏ 
على المستخدم دفع تكاليف موارد 4515 اللازمة لتخزين وتنفيذ التطبيقات. 
:TBM Bluemix‏ وهو منصة سحابة تتيح للمستخدم إنشاء تطبيقات باستخدام عدة تقنيات 
مجانية على الحاسب. GEE LS‏ المستخدمين من نشر وإدارة التطبيقات المختلطة باستخدام 
البرنامج. ومع 1172502 182/1 والتي تتوفر خدماتها على :811016121 181/1 يستطيع المستخدمون 
الآن إنشاء تطبيقات إدراكية للجيل القادم والتي تستطيع الاكتشافء والابتكارء واتخاذ القرارات. 
كما يمكن استخدام خدمات 11731502 181/1 لتحليل العواطف وتحويل النص إلى كلام مسموع 
بصوت tub‏ حيث يستخدم 11726507 مفهوم الحوسبة الإدراكية لتحليل النصوص ومقاطع 
الفيديو والصورء وهو يدعم لغات البرمجة .Pythons Rubys PHPs Gos Java Js‏ 
Azure auð olau dai slèsh (Microsoft) 3545 Sol. C : Microsoft Azure‏ 
لتقوم بإنشاء ونشر وإدارة التطبيقات والخدمات من خلال شبكة مراكز بيانات مايكروسوفت 
PaaS go JS JSA de Jas eg (Microsoft)‏ و1435 وتقدم العديد من الحلول كالتحليلات 
ومستودعات البيانات والمراقبة عن بُعد والصيانة التنبؤية. 


V-A‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


:Google App Engine‏ وهو منصة حوسبة سحابية من خدمات 600816 تُستخدم لتطوير واستضافة 
التطبيقات: وهي ثدار من خلال مراكز Google cL»‏ تدعم تطبيقات التطوير في Python zay Ol‏ 
PHP; Ruby; Javas‏ وتوفر بيئة 8180112 خدمات مستودع البيانات من خلال السحابة. 

:OpenShift‏ وهوعبارة عن منصة تطبيقات سحابية تابعة ل 1186 160 قائمة على نموذج 
5. ومن خلال هذا النموذجء يتمكن مطورو التطبيقات من نشر تطبيقاتهم على السحابة. 
ويتوفر نموذجان مختلفان ل-625111م0. يعمل أحدههما بمثابة 2285 العامة والآخر بمثابة 
5 الخاص. إن عضنلاط0 1ا5مءم0 هونظام 2235 العام في 1134 1160 والذي يعرض تطوير 
وبناء واستضافة ونشر التطبيقات في السحابة. ويسمح 2085 الخاص؛ OpenShift Enterprise‏ 
بتطوير وبناء ونشر التطبيقات على خادم داخلي أو منصة سحابية خاصة. 


التحليلات كخدمة :(AaaS)‏ 


تعتبر التحليلات والحلول الإدارية القائمة على البيانات بمثابة التطبيقات التي تستعلم عن 
البيانات لاستخدامها في تخطيط الأعمال» وحل المشكلات» ودعم القرارء وهي تتطور بسرعة 
وتُستخدم تقريبًا من جانب جميع المنظمات. ويتم إغراق ا مؤسسات با معلومات» ويمثل الحصول 
على أفكار من هذه البيانات Ly) Bus Gaos‏ وبالإضافة لذلك» توجد تحديات تتعلق بأمن 
وجودة البيانات والالتزام. ويعتبر 4285 منصة تحليلية قابلة للتوسع باستخدام نموذج التوصيل 
القائم على السحابةء حيث تقوم أدوات تحليل بيانات ذكاء الأعمال والبيانات المختلفة بمساعدة 
الشركات في صنع القرار بشكل أفضل والحصول على أفكار من بياناتها الضخمة. وتغطي المنصة 
جميع النواحي الوظيفية ابتداءًَ من جمع البيانات من الأجهزة المادية وانتهاءً بتصوير البيانات. 
ويوفر 4235 للشركات نموذجًا ذكيًا لإعداد التقارير والتحليلات مما يمكنهم من التركيز على ما 
يفعلون بأفضل ما يمكن. كما يمكن للعملاء تنفيذ تطبيقاتهم التحليلية الخاصة في السحابة أو 
وضع بياناتهم على السحابة واستقبال أفكار مفيدة. 

وتضم 4835 جوانب الحوسبة السحابية إلى تحليلات البيانات الضخمة» ومن علماء البيانات 
والمحللين من خلال السماح لهم بالوصول إلى مجموعات بيانات المعلومات التي تتم إدارتها بشكل 
مركزي. ويمكنهم الآن استكشاف مجموعات بيانات المعلومات بصورة تفاعلية أكثر واكتشاف 
الأفكار الأكثر ثراءً بشكل أسرع. وبالتالي تجنب العديد من التأخيرات التي قد يواجهونها أثناء 
اكتشاف اتجاهات البيانات. فمثلًا قد يوفر المورد الوصول إلى منصة تحليلية عن بُعد في مقابل 
دقع رسوم» ويتيح ذلك للعميل استخدام برامج التحليلات كلما لزم الأمر. ويعتبر 4385 جزءًا من 
ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۷۹ 


الفصل الثامن 


5 و445 و1445 وبالتالي يساعد تقنية المعلومات بشكل معنوي على تقليل كل من التكاليف 
وخطر الالتزام» في حين يرفع من إنتاجية المستخدمين. 

على سبيل المثالك يصل موظفو 688 إلى شريحة افتراضية لخادم مستودع البيانات الرئيس 
بحيث يمكنهم تخزين وتحليل مجموعات البيانات الخاصة بهم. وقد حققت أسواق بيانات eBay‏ 
الافتراضية الخاصة نجاحًا كبيرًا فيما يتراوح من 00 إلى ٠٠١‏ عملية في وقت واحد. وقد ألغت أسواق 
البيانات الافتراضية احتياج الشركة إلى أسواق بيانات مادية جديدة» والتي تقدر تكلفتها بمليون 
دولار لكل منها وتتطلب اهتمامًا طوال الوقت من عدة موظفين 553( (Winter, 2008) lle‏ 

لدى 4225 في السحابة وفورات الحجم والمدى من خلال توفير العديد من التطبيقات 
التحليلية الافتراضية مع مزيد من القابلية للتطوير وتوفير التكلفة. ومع تزايد أحجام البيانات 
وعشرات من التطبيقات التحليلية الافتراضية. تكون هناك فرص بأن الكثير منها يستفيد با معالجة 
في أوقات مختلفةء وأنماط الاستخدام: .(Kalakota, 2011) Shh Sla‏ 

يعتر التنقيب في كل من البيانات والنصوص تطبيقًا آخر واعدًا جدًّا من 48. كن أيصًا استخدام 
الإمكانيات التي يجلبها توجيه الخدمة (بجانب الحوسبة السحابية والموارد المجمّعة والمعالجة المتوازية) 
إلى عامم التحليلات من أجل التحسين واسع النطاق» ومشاكل القرارات متعددة ال معايير ا معقدة جد 
ونماذج ا محاكاة الموزعة» ثم نحدد بعد ذلك عروض التحليلات المنتقاة والقانمة على السحابة. 


التحليلات الممثلة كعروض خدمة: 


تحلیلات ۸51۴۴ كخدمة: تعتبر ئ۸ 1٠۲443‏ هي المحرك الرئيس في تقديم التحليلات 
كخدمة. وتشتمل Aster‏ على awî) Aster MapReduce Analytics Foundation ja J‏ 
معالجة البيانات عبر مجموعات هائلة من البيانات)» Q^ 39$ ga Aster Graph Analyticss‏ 
أدوات ذكاء الأعمال الأخرى. Aster AaaS gag‏ تستطيع الشركات الحصول على أفكار قيّمة من 
بياناتهاء مما يساعدها في اتخاذ قرارات أفضلء دون عمل أي استثمار صريح في البنية التحتية. 

ANALYTICS‏ 11415027 1831: توفر 1831 جميع عروض التحليلات من خلال خدمة 
Analytics o5) Ca tls 420JI Bluemix 4t LI‏ 117250 18231 بدمج معظم خصائص 
وإمكانيات التحليلات التي هكن بناؤها ونشرها من خلال جص عں81. بالإضافة إلى ذلكء قدم 
Watson Cognitive‏ 183/1 عرضًا أساسيًا قائما على السحابة يستخدم التنقيب ف النص والتعلم 
العميق بمستوى عالٍ جدًا. وقد عرضنا لذلك من قبل في سياق الحديث عن التنقيب في النص. 


vie‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


111511 يعد التنقيب في النص واحدًا من ا مجالات النامية في عام 
التحليلات. يعمل التنقيب في النص على تحديد موضوعات الوثائق ذات المستوى العالي» واستنتاج 
امشاعر من الاستعراضات» وتصوير الوثيقة أو علاقات المصطلح / المفهوم وقد تم شرح ذلك 
بالتفصيل في فصل التنقيب في النص. وتقدم 16<].201 211260417 هذه الإمكانيات في السحابة 
من خلال موقع الويب الخاص بهم. 

تحليلات وإحصاءات 545 المرئية: يوفر معهد 545 برمجيات التحليلات الخاصة به عند 
الطلب من خلال السحابة. وحاليًاء تتوفر إحصاءات 54S‏ المرئية فقط كخدمة سحابة وتكون 
„Tableau J 4..3Us‏ 

TABLEAU‏ وهو أحد أهم البرامج المرئية وقد تم تقدهه في سياق الحديث عن التحليلات 
الوصفية: ويتوفر أيضًا من خلال السحابة. 

18آ2011711:: وهو أحد حلول مستودعات البيانات القائمة على السحابة؛ حيث يستطيع 
ا مستخدمون جمع بياناتهم من مصادر متعددة كمصدر واحد وتحليلها باستخدام عل50010112. 

BY GENERAL ELECTRIC‏ 2218211 : كما ذكرت التقارير» أن جنرال إلكتريك تركز 
على تطوير منصة إنترنت الأشياء للتحليلات التنبؤية لمساعدة عملائها في الوصول إلى تشغيل 
وإدارة المعدات والمنصات الصناعية بشكل أفضل. وقد طورت الشركة عرضًا تحليليًا جديدًا 
يطلق عليه 2:01 (وقد تمت مناقشته في حالة عملية 1-8): وهو متوفر عبر السحابة من خلال 
خدماتٽ Services‏ 1116 4112202 وسيتوفر قريبًا من „Microsoft Azure Jl‏ 
تطبيقات تحليلات توضيحية باستخدام البنية التحتية للسحابة: 

في هذا القسم. نسلط الضوء على عدة تطبيقات تحليلات سحابية» وسنعرضهم كقسم واحد 
في مقابل حالات عملية منفردة. 

مركز MD Anderson‏ للسرطان يستخدم إمكانيات الحوسبة الإدراكية لشركة 
Watson‏ 181 بلنح مرضى السرطان علاجًا أفضل: 

يعتبر مركز جامعة 420617505 (1/11 1235 للسرطان (والذي يطلق عليه مركز 
3 للسرطان) واحدًا من أفضل مستشفيات السرطان في الولايات المتحدة. 
فمنذ عام 196١‏ عالج مركز 1٠١ oL Ib AU MD Anderson‏ ألف مريض بالسرطان 
ولديه حوالي ۱۹ ألف موظف. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vM‏ 


الفصل الثامن 


حيث يتم في كل عام علاج حولي ٠٠١‏ ألف مريض بالسرطان في MD Anderson‏ 
ومحيطه المحلي والقومي. ونتيجة لذلك؟ تراكم لدى المركز الكثير من البيانات الإكلينيكية 
للأورام تخص مرضى المركزء وتش مل البيانات الرعاية ا مقدمة للمرضىء والتجارب 
الإكلينيكية» ونتائج اختبارات المرضى» ويتم ذلك بشكل يومي» سواء في ملاحظات الباحثين 
والأطباء أو ا موجودة في قواعد البيانات عن بُعد وملفات الأطباء الآخرين الذين عالجوا 
هؤلاء المرضى في الماضي. وقد أدرك مسؤولو 8206508 212 أنه إذا تم جمع وتحليل 
كل هذه ال مجموعة من البيانات الضخمة في مصدر واحد وتحليلهاء فسوف يساعد ذلك 
الأطباء في التجارب الإكلينيكية ومن ثَّمّ تحديد أفضل اختيارات لعلاج مرضاهم. 


“Moon Shots” j5lg:ss ls5,; MD Anderson أصدر مسؤولو‎ 7 ele ds 
للعثور على علاجات أفضل للسرطان. كما‎ 181/4 Watson وقاموا بإجراء تحليلات ممحتوى‎ 
قاموا بتطوير منصة تقنية تسمى 4۴0110 تجمع كل البيانات المتفرقة غير المهيكلة‎ 
IBM للمرضى في نظام واحد للسجلات الطبية الإلكترونية (81/41)» حيث يتكامل‎ 
بسلاسة مع نظام 803412 ويستخدم تحليلات ا لمحتوى لإنشاء ملف تعريف‎ 
شامل لكل مريض بالسرطان في شكل مهيكل للأطباء. فهي تساعد الأطباء على التشخيص‎ 
الأفضل لحالة المريض وتمْكّنهم من إجراء مقارنة بين المرضى استنادًا إلى مجموعة جديدة‎ 
MD Anderson من السمات ا معتمدة على البيانات. والآنء يستطيع فريق أطباء مركز‎ 
مقارنة مجموعة من المرضى لتحديد أولئك الذين يستجيبون يشكل مختلف للعلاجات‎ 
واكتشاف السمات المسؤولة عن هذه الاختلافات. كما يمكن للأطباء الآن عرض المرضى‎ 
على المشاركة في التجارب الإكلينيكية على العلاجات الجديدة بناءً على الدليل والخبرة.‎ 
Sources: MDanderson.org. (2013). MD Anderson taps IBM Watson to power 
"Moon Shots" mission. https//www.mdanderson.org/newsroom/201310//md- 
anderson-ibm-watson-work-togetherto-fight-cancer.html (accessed August 
2016); IBM.com (2015). Smarter care at MD Anderson. http://www-03.ibm.com/ 
software/businesscasestudies/us/en/corp*synkey-H447240O66679238 (accessed 
August 2016); YouTube.com. (2014). Smarter care at MD Anderson. https://www. 
youtube.com/watch?v-savJ8VQOKcA (accessed August 2016). Wikipedia.org. (n.d.). 


University of Texas MD Anderson Cancer Center. https://en.wikipedia.org/wiki/ 
University of Texas MD Anderson Cancer Center (accessed August 2016). 


vw‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


مدارس التعليم العام في تاكوماء واشنطون تستخدم Microsoft Azure Machine Learning‏ 
للتنبؤ بالتسربات من التعليم: 

تعتبر مدارس تاكوما العامة هي الإدارة التعليمية الرئيسة في تاكوماء واش نطن. 
وتتكون من ٠١‏ مدرسة ابتدائية و٩‏ مدارس متوسطة 59 مدارس ثانوية. وهي تعتبر ثالث 
أكبر إدارة تعليمية في ولاية واشنطن» بأكثر من ٠٠٠٠١‏ طالب وأكثر من 0٠٠١‏ موظف. 


وقد أشارت دراسة أجريت في عام ٠٠١1‏ إلى خمس مدارس ثانوية من مدارس تاكوما 
العامة على أنها ”مصانع للتسرب"“. وبحلول عام ٠٠١‏ كان الموقف في غاية السوء. فقد 
حصل فقط X00‏ من طلاب المدارس الثانوية على شهادة الدبلوم الخاصة بهم في الوقت 
المحدد. وهومعدل أقل بكثير من المعدل الوطني البالغ /#8. كان لدى الإدارة التعليمية 
الكثير من البيانات الخاصة بالطلاب كدرجات الاختبارء وأماكن الإقامة. ومدارسهم 
الابتدائية والمتوسطة التي أتوا منها. فأرادوا باستخدام هذه البيانات أن يوجدوا gi) Yo‏ 
معدلات التخرج. كما أرادوا أيضًا التنبؤ المسبق بالطلاب الذين من المحتمل تسربهم 
من التعليم» وذلك لمنحهم اهتمامًا خاضًا بمشاكل الطفل ومن ثَّمّ اتخاذ إجراءات وقائية. 

شرعت مدارس تاكوما العامة في استكشاف حلول متنوعة لذكاء الأعمال من 
أجل تحليل بياناتها. وتعاونت خدمات استشارات مايكروسوفت g (Microsoft)‏ 
المنطقة التعليمية وقامت بإنشاء مستودع بيانات يلتقط معلومات تخص الطالب 
كالصحة والدرجات ونسبة الحضور وتفاصيل إضافية مستقاة من أنظمة معلومات 
طلاب المدرسة. كما ساعدت خدمات الإكسيل التابعة لمايكروسوفت (Microsoft)‏ 
و162011 المدرسين في مراجعة البيانات التاريخية لطلابهم والإجراءات التي تم 
اتخاذها على المقاييس المشاهدة. وقد ساعدهم ذلك على قياس تقدم الأطفال مجتمعين 
وتحديد مقدار جودة أداء المدرسة في مساعدة الأطفال على التقدم للأمام. 

LEG‏ أرادت الإدارة التعليمية التنبؤ بالطلاب المحتمل تسربهم من التعليم حتى 
يتمكنوا من مساعدتهم بشكل مسبق والعمل معهم عن قرب. ومرةً أخرىء تعاون 
مسؤولو الإدارة مع شركة مايكروسوفت (811670501) لإنشاء نموذج بيانات يبرهن 
المفهوم 255 «Microsoft's Azure Machine Learning (ML) Je x:‏ وهو حل 
تحليلي تنبؤي يستند إلى المنصة السحابية التابعة ممايكروسوفت (Microsoft)‏ 48$ 
قام هذا النموذج بتحليل البيانات التي تم رفعها Azure J!‏ من أنظمة معلومات 
متعددة على مباني الحرم الجامعي. وقام مصنع بيانات 4210156 بتمكين خط أنابيب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vr‏ 


الفصل الثامن 


تنبؤي يستخدم نموذج ,811 42106 للتنبؤ بتعرض الطالب لخطر التسرب. ويتم وضع 
النتائج التنبية من خلال قاعدة بيانات .501 421156 1/11505016. بحيث يتمكن 
أعضاء طاقم العمل وأعضاء مجلس الإدارة التعليمية من مراجعة النتائج باستخدام 
لوحات معلومات 81 201961. وهكذا تمكنت الإدارة من رفع معدلات التخرج طمدارس 
تاكوما العامة من 00 في عام ۲٠٠١‏ إلى ۸۲,١‏ قي عام ۲١٠١‏ وذلك مساعدة التحليلات 
llتنبığة .Microsoft Azure Machine Learnings‏ 
Sources: Blogs.technet.microsoft.com (2015). ML predictsschool dropout risk & boosts‏ 
graduation rates. https://blogs.technet.microsoft.com/machinelearning/201504/06//‏ 
ml-predicts- school-dropout-risk-boosts-graduation-rates/(accessed August 2016);‏ 
Customer.microsoft.com (2015). Tacoma Public Schools: Predicting student dropout‏ 
risks, increasing graduation rates with cloud analytics. https://customers.microsoft.‏ 
com/Pages/CustomerStory.aspx?recid-20703 (accessed August 2016); YouTube.com‏ 
The saving power of data. https://www.youtube.com/watch? v-rfAoKs8XxzY‏ .)2016( 
(accessed August 2016).‏ 


Dartmouth-Hitchcock 55,4‏ !14( 435 الرعاية الصحية المسبقة الشخصية 


:Microsoft Cortana Analytics Suite elazzb 


يقع مركز عكهمءاء]10112010]1-111 الطبي (1(11810) في لبنانء نيوهامبشاير. 
وهو المركز الطبي الأكاديمي الوحيد في نيوهامبشاير وبه ما يقرب من 2٠١‏ سرير. 
ويسعى هذا المركز أن تحدد بشكل مسبق صحة الأفراد المحتمل إصابتهم بالأمراض 
وبالتالي وقايتهم قبل الوقوع في فخ المرض. ويتمثل هدفهم في توفير الرعاية الصحية 
الشخصية بتكلفة أقل. فتقوم الممرضات وال مدربون الصحيون بتتبع الحالة الصحية 
للمريض أولًا بأول» ويتم جمع البيانات باستخدام أجهزة استشعار مرفقة بأجهزة ضغط 
الدم وأجهزة قياس النبض وأجهزة تتبع النشاطات مثل 8114 ۲؟0وهإء1. ويتم نقل 
هذه البيانات إلى سحابة 421156 باستخدام الهواتف الذكية. ثم يتم عرض البيانات 
على لوحات المعلومات التي تتم مراقبتها بشكل مستمر ١6‏ ساعة في اليوم سبعة أيام 
في الأسبوع بواسطة الممرضات المسجلات باستخدام Microsoft Cortana Analytics‏ 
©1أنا5. وعندما تتخطى بيانات المريض حد السلامة» يتم تنبيه الممرضات» اللاتي يقمن 
gò‏ بالتواصل مح ا مريض» وبالتالي يتم تجنب المريض لخطر أي مشكلة خطيرة. وكنتيجة 
لاستخدام تقنية مايكروسوفت (50۴٥إءM1)‏ هذه» هكن مراقبة صحة ال مريض عن بُعد 
من منزل المريضء مما يساعد على تقليل تكلفة الزيارات المنتظمة للأطباء. 


vie‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


Sources: Blogs.microsoft.com (2015). Dartmouth-Hitchcock ushers in a new age 
of proactive, personalized healthcare using Cortana Analytics Suite. http://blogs. 
microsoft.com/transform/201513/07//dartmouth-hitchcock-ushers-in-a-new- age- 
of-proactive-personalized-healthcare-using-cortana-ana- lytics-suite/(accessed 
August 2016); Enterprise.microsoft.com. (2015). How Dartmouth-Hitchcock is 
challenging healthcares status quo with Cortana Analytics. https://enterprise. 
microsoft. com/en-us/industries/health/how-dartmouth-hitchcock-is-chal- lenging- 
healthcares-status-quo-with-cortana-analytics/(accessed August 2016); YouTube. 
com. (2015). Dartmouth-Hitchcock revolutionizes the U.S. healthcare system. 
https://www.youtube.com/watch?v=-wVeHZNn8aU (accessed August 2016). 


Mankind Pharma‏ تستخدم بنية السحابة التحتية 18M‏ لتقليص وقت تنفيذ 
التطبيق بنسبة AIA‏ 

à Usa 52] 1 5,5 Mankind Pharma 5:55‏ نيودلهي» الهندء هي رابع أكبر منتج 
للوصفات الطبية المخدرة في الهند حيث يعمل بها ١١‏ ألف موظف وتبلغ إيراداتها ٠٠١‏ مليون 
دولار. ومع أعمالها المتنامية, Pharma Col‏ 21301484 تبحث عن بيئة استضافة سحابية 
لتوفير بنية تحتية منصة الموارد البشرية (1110) الخاصة بها وللمهمات الحساسة الأخرى. 

وفي سبيل ذلك شرع الفريق الفني بشركة 1131420 في استخدام منصة سحابة 
BM‏ وتسمى 501113(618: والتي تحتوي على مراكز بيانات وخوادم فلزية معزولة في 
جميع أنحاء العالمء مما يساعد 1131424 على القيام بمهام أعمالها الحساسة على نطاق 
ble‏ وبالفعل انخفض وقت تنفيذ تطبيق الشركة بنسبة ٩۸‏ وذلك باستخدام خدمة 
البنية التحتية ل #۲ره1ا؟ه؟. والآن أصبح بإمكان العملاء الحصول على التطبيق في 
غضون ساعات بدلا من 10 يومًا كما كان يحدث في السابق. 
Sources: IBM.com (2014). Softlayer hosting platform reduces application‏ 
implementation time by 987. http://www-03.ibm.com/software/businesscasestudies/‏ 
us/en/corp?synkey-Y979749150926G25 (accessed August 2016); 010.18.‏ 
Mankind Pharma finds an antidote in IBM solution for improving app‏ .)2015( 
implementation time (accessed August 2016). http://www.cio.in/solution-center/‏ 
emc/55281; CxOtoday.com (2014). Cloud platform to help Pharma Co accelerate‏ 
growth. http://www.cxotoday.com/story/mankind-pharma-to-drive-growth-with-‏ 


softlayers-cloud-platform/(accessed August 2016); Wikipedia.org.(n.d.). Mankind 
Pharma. https://en.wikipedia.org/wiki/Mankind_Pharma (accessed August 2016); 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vio‏ 


الفصل الثامن 


Mankindpharma.com.  (n.d. Overview. — https://www.mankindpharma.com/ 


company/companyoverview (accessed August 2016). 

الخليج للطيران تستخدم البيانات الضخمة للحصول على رؤية أعمق للعملاء: 

تعتبر الخليج للطيران هي شركة النقل الوطني لدولة البحرين. وهي شركة 
طيران دولية رائدة يعمل بها ٠٠٠٠١‏ موظف. وتخدم 60 مدينة في ١6‏ دولة عبر ٠‏ 
قارات. وهي رائدة في توفير الضيافة العربية التقليدية للعملاء. ولمعرفة المزيد عما 
يشعر به عملاؤهم بشأن خدمات ضیافتهم» تابعت الشركة ما يشاركه عملاؤهم على 
وسائل التواصل الاجتماعي في هذا الصدد. وكان التحدي هو تحليل جميع تعليقات 
ومنشورات العملاءء فقد كان هناك مئات الآلاف من المشاركات كل يوم. وتعتبر مراقبة 
هذه المشاركات يدويًا مهمة شاقة ومستهلكة للوقت كما ستكون عرضة للخطأ البشري. 

أرادت شركة الخليج للطيران جعل هذه المهمة وتحليل البيانات لمعرفة الاتجاهات 
السوقية حديثة الظهور تتم بصورة تلقائية. كما أرادت الشركة تأسيس بنية تحتية قوية 
لاستضافة مثل هذا الحل لمراقبة وسائل التواصل الاجتماعي والتي ستكون متاحة على 
مدار الساعة وخفيفة الحركة عبر الحدود الجغرافية. 

طؤرت الخليج للطيران حلا لتحليل المشاعرء ”تحليل المشاعر العربية“. والذي يحلل 
منشورات وسائل التواصل الاجتماعي الإنجليزية والعربية. وتستند أداة تحليل المشاعر 
العربية على توزيع 0100612 لإطار عمل م118000 للبيانات الضخمة. وهي تعمل 
على بيئة السحابة الخاصة التابعة لشركة الخليج للطيران كما تستخدم منصة 1186 1864 
.JBoss Enterprise Application‏ تحمل هذه السحابة الخاصة حوالي 0٠0‏ تيرابايت 
من البيانات» ويمكن لأداة تحليل المشاعر العربية تحليل آلاف المنشورات على وسائل 
التواصل الاجتماعيء مما يوفر نتائج المشاعر في ظرف دقائق. 

وقد حققت شركة الخليج للطيران وفورات جوهرية في التكاليف من خلال وضع 
تطبيق ”تحليل المشاعر العربية“ على بيئة السحابة الخاصة الحالية للشركة حيث 
إنهم لم يكونوا بحاجة لأن يستثمروا في إعداد البنية التحتية لنشر التطبيق. وتستعين 
الخليج للطيران بأداة ”تحليل المشاعر العربية“ في تحديد العروض الترويجية لعملائها 
على أساس زمني وتساعدهم على الجلوس في مقدمة منافسيها. ويلواجهة حالة تعطل 
الخادم الأماسيء أنشأت الشركة ”صورًا شبحية“ للخادم يمكن نشرها بسرعة. ويمكن أن 
تبدأ الصورة في لعب دور الخادم. ويقوم حل البيانات الضخمة بسرعة وكفاءة بالتقاط 


11 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


ا منشورات بشكل دوري وتحويلها إلى تقاريرء مما يجعل شركة الخليج للطيران على دراية 
تامة بأي تغييرات في ا مشاعر أو تغيرات في الطلب» مما هكنها من تقديم استجابة سريعة. 
فكان لأفكار حل البيانات الضخمة آثرّا إيجابثًا على أداء موظفي شركة الخليج للطيران. 

Sources: RedHat.com. (2016). Gulf Air builds private cloud for Big Data innovation 
with Red Hat Technologies. https://www.redhat.com/en/about/press-releases/ 
gulf-air-builds-private-cloud-Big-data-innovation-red-hat-technologies; (accessed 
August 2016); RedHat.com (2016). Gulf Air's Big Data innovation delivers deeper 
customer insight. https://www.redhat.com/en/success-stories(accessed August 
2016); ComputerWeekly.com. (2016). Big-data and open source cloud technology 
help Gulf Air pin down customer sen- timent. http://www.computerweekly.com/ 
news/450297404/Big- data-and-open-source-cloud-technology-help-Gulf-Air-pin- 


down- customer-sentiment (accessed August 2016).‏ 
Chim‏ تحسن تجربة العملاء باستخدام :Snowflake‏ 
يوفر 1۴ط)٤»‏ وهوخيار مصرفء بطاقة ائتمان فيزا. وحساب ۴21٥‏ الممؤمن للصرف 
والتوفير. وتطبيق على الهاتف الجوال يسهل الخدمات المصرفية للأفراد. وأراد مسؤولو عدمنط© 
التعرف على مشاركات عملائه. كما أرادوا تحليل البيانات عبر المنصات الخاصة بهم للجؤالء 
والويب. والنهاية الخلفية لتحسين تجربة المستخدم. elis gas‏ فقد كانت عملية سحب 
البيانات وتجميعها من مصادر lass Googles Facebook cbe] cola Jio baseia‏ 
من الأدوات التحليلية الأخرى التابعة لطرف ثالث «(JASON Object Notation) JSON J£‏ 
مهمة مرهقة. لقد سعوا للوصول إلى حل ينهم من تجميع البيانات من هذه المصادر 
المتعددة وتحليل مجموعة البيانات. لقد كان ۴ط بحاجة إلى حل مكنه معالجة مصادر 
بيانات 15011 والاستعلام عنها باستخدام جداول قاعدة بيانات .501 المعيارية. 
شرع 1۴ط فی استخدام حل مستودع بیانات Snowflake Elastic‏ |5 46 
01131 بسحب البيانات من جميع مصادر بيانات 01126 والبالغ عددها 
١5‏ مصدراء وقد شمل ذلك بيانات مثل وثائق 150171 من التطبيقات. فقد عملت 
500101131 على مساعدة 0136 في تحليل بيانات 15011 بسرعة لتحسين خدمات 
الأعضاء وتقديم تجربة مصرفية أكثر خصوصية للعملاء. 
Source: Adapted from Snowflake.net. (n.d.). Chime delivers personalized customer‏ 


experience using Chime. http://www.snow-flake.net/product (accessed August 2016). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vw‏ 


الفصل الثامن 


إننا بصدد دخول ”عصر البيتابايت“ وتبدأ الأساليب التقليدية للبيانات والتحليلات في 
عرض حدودها. وتعتبر تحليلات السحابة حلا بديلًا حديث الظهور لتحليل البيانات على نطاق 
واسع. وتشتمل الأنظمة السحابية اموجهة بالبيانات على التخزين والحوسبة في بيئة موزعة 
وافتراضية. وتعتبر الميزة الأساسية لهذه العروض هي الانتشار السريع لأدوات التحليل المتقدمة 
بين المستخدمينء» دون استثمار معنوي في الاستحواذ على التقنية. غير أن هذه الحلول يصاحبها 
yal Lái‏ من التحديات» مثل الأمان ومستوى الخدمة والتحكم في البيانات. فقد اكتنف 
الحوسبة السحابية عدد من المخاوفء منها فقدان السيطرة والخصوصية: والمسؤوليات القانونية, 
والقضايا السياسية عبر الحدودء وما hs] l8 Cloud Security càJlxJ (355. .5U3 (JI‏ ثلاثة 
تهديدات أمنية في السحابة هي فقدان البيانات وتسر بهاء وتعطل الأجهزة واب معدات» والواجهة 
غير الآمنة. فجميع البيانات في السحابة يستطيع مقدم الخدمة الوصول إليهاء وبالتالي يمكنه 
أن يغير البيانات بشكل غير مقصود أو متعمد كما يمكنه تمرير البيانات إلى طرف ثالث لأغراض 
قانونية دون طلب من الشركة. ولا تزال البحوث محدودة في هذا المجال. وكنتيجة لذلك: فهناك 
فرصة كبيرة لإدخال النمذجة التحليلية والحسابية والمفاهيمية إلى سياق علم الخدمةء وتوجيه 
الخدمة» والذكاء السحاي. ومع ذلك» تعتبر الحوسبة السحابية مبادرة مهمة لمحترف التحليلات 
أن يشاهدها على أنها مجال سريع النمو. 
أسئلة مراجعة على القسم Y-A‏ 
-١‏ عرّف الحوسبة السحابية. وكيف تتعلق ب 2225 و5385 SIaaSg‏ 
؟- أعط أمثلة لشركات تقدم الخدمات السحابية. 
- كيف تؤثر الحوسبة السحابية على ذكاء الأعمال؟ 
-٤‏ كيف يقوم 0448 بتغيير طريقة التعامل مع البيانات؟ 
-٥‏ ما هي الأنواع ال مختلفة لامنصات السحابية؟ 
1- لماذا تعتبر 4885 فعالة من حيث التكلفة؟ 
۷- اذكر على الأقل أسماء ثلاثة من كبار مقدمي الخدمات السحابية. 


8- أعط على الأقل ثلاثة أمثلة لمقدمي خدمات 4225. 


VA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


٠۸‏ التحليلات القائمة على الموقع بالنسبة للمنظمات: 

لقد رأينا حتى الآن العديد من الأمثلة على المنظمات التي تستخدم تقنيات تحليلية من 
أجل اكتساب نظرة ثاقبة في عملياتها الحالية من خلال تقديم المعلومات» والتحليلات التنبؤية, 
والتوقع» وأساليب الأمثلية. وفي هذا القسم» سوف نتعرف على اتجاه ناشئ بالغ الأهمية وهو 
دمج بيانات الموقع في التحليلات. ويُعطي الشكل (1-1) تصنيقًا للتطبيقات التحليلية القائمة على 
الموقع. وسوف نقوم أولًا باستعراض التطبيقات التي تستفيد من بيانات الموقع الثابتة والتي 
عادةً ما تُسمى بالبيانات الجغرافية ال مكانية. ومن تم سنقوم بعد ذلك بفحص التطبيقات التي 
تستفيد من جميع بيانات الموقع الذي يتم إنشاؤه بواسطة أجهزة اليوم. ويركز هذا القسم Joj‏ 
على تطبيقات التحليلات التي تطورها المنظمات من أجل اتخاذ أفضل قرارات في إدارة Ollas‏ 
واستهداف العملاء. والتقدم» وهكذاء ثم سنقوم أيضًا باستكشاف تطبيقات التحليلات التي يتم 
تطويرها ليستخدمها المستهلك بشكل مباشرء كما أن بعضها يستفيد أيضًا من بيانات الموقع. 








2 التحليلات القاتمة على المرقع‎ 00٠ 
iul, التوجه بالمستهلك التوجه‎ 
طريقة الموقع المتحرك طريقة الجغرافيا المكانية الثابتة طريقة الموقع المتحرك طريقة الجغرافيا المكانية الثابتة‎ 
٠ةرشابملا تانج الموقع‎ a š تحليل تاريخى وحالى لطلب‎ 
الموقع امواقف تتيزية؟ وس عزو رة فحص مواقع الأماكن الجغرافية‎ 
الشبكات الإجتماعية الصحية 3 فى الوقت المذاسب‎ 























شكل 5-8: تصنيف تطبيقات التحليلات القائمة على الموقع 

التحليلات الجغرافية المكانية: 

عادةً ما يتم تمثيل رؤية موحدة للأداء العام للمنظمة من خلال أدوات التصوير المرئي التي توفر 
معلومات قابلة للتطبيق. وقد تتضمن المعلومات القيم الحالية والقيم المتوقعة للعوامل التجارية 
المختلفة ومؤشرات الأداء الرئيسة (1215). إن النظر في مؤشرات الأداء الرئيسة كأرقام إجمالية 
عبر كل من الرسوم البيانية والمخططات المختلفة يمكن أن يكون ساحقًا. وهناك خطر كبير يتعلق 
بفقدان فرص النمو المحتملة أو عدم تحديد مجالات الجدل. وتستخدم المنظمات الخرائط البصرية 
التي يتم تعيينها جغرافيًا والتي تعتمد على بيانات الموقع التقليدية» كبديل ممجرد عرض التقاريرء 
وعادةً ما يتم تجميع هذه الخرائط البصرية بواسطة الرموز البريدية. وتعمل الأساليب التحليلية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vis‏ 



































الفصل الثامن 


القائمة على الموقع التقليدي والتي تستخدم الترميز الجغرافي للمواقع التنظيمية والمستهلكين على 
عرقلة المنظمات عن فهم آثار «الموقع الحقيقي». وتقدم المواقع القائمة على الرموز البريدية عرضًا 
مجمعًا لمنطقة جغرافية كبيرة. وهذه الدقة المنخفضة قد لا تساعد في تحديد فرص النمو داخل 
المنطقة. حيث يمكن أن يتغير موقع العملاء المستهدفين بسرعة. وهكذاء فإن الحملات الترويجية 
الخاصة بالمنظمة قد لا تستهدف العملاء المناسبين إذا اعتمدت على الرموز البريدية. ولمعالجة 
هذه المخاوفء فإن المنظمات تضم الموقع والتوسعات المكانية للتحليلات (2010 ,نا 6©). حيث 
إن إضافة مكونات الموقع التي تعتمد على السمات الطولية والعرضية للأساليب التحليلية التقليدية 
تكن المنظمات من إضافة بعد جديد يتعلق بالسؤال «أين» إلى تحليلات الأعمال التقليدية الخاصة 
بهم» والذي يُجيب حاليًا على الأسئلة التي تتعلق ب«من» و<«ماذا» و«متى» و«ما مقدار». 

الجدير بالذكر أن البيانات التي تعتمد على الموقع يمكن الحصول عليها الآن بسهولة من نظم 
المعلومات الجغرافية (618)» وهي تُستَخْدَم لرصد. وتخزين: وتحليلء وإدارة البيانات المرتبطة 
بموقع باستخدام تقنيات الاستشعار المتكاملة» والأنظمة العالمية لتحديد المواقع المثبتة في الهواتف 
الذكيةء أو من خلال نشر تقنية تحديد الهوية باستخدام موجات الرادیو(۸۴12) في مجال البيع 
بالتجزئة وصناعات الرعاية الصحية. 

ومن خلال دمج المعلومات التي تدور حول الموقع مع بيانات الأعمال المهمة الأخرىء تقوم 
المنظمات عندئذ بإنشاء معلومات للمواقع (2010 òjo psig (Krivda,‏ ذكاء ا موقع بتمكين 
المنظمات من اكتساب رؤى دقيقة واتخاذ قرارات أفضل من خلال تحسين كل من العمليات 
والتطبيقات المهمة. وتعمل المنظمات الآن على إنشاء خرائط تفاعلية والتي من شأنها دعم التعمق 
في التفاصيل حول أي موقعء فضلًا عن أنها توفر للمحللين القدرة على البحث عن اتجاهات جديدة 
والربط بين العوامل الخاصة با موقع عبر مؤشرات الأداء الرئيسة المتعددة 121. ويمكن للمحللين الآن 
تحديد الاتجاهات والأماط بدقة في كل من الإيرادات» والمبيعات» والربحية عبر المناطق الجغرافية. 

ومن خلال دمج التفاصيل الدمموغرافية داخل المواقع. يستطيع تجار التجزئة تحديد 
كيفية اختلاف المبيعات حسب مستوى السكان والقرب من المنافسين الآخرين؛ بالإضافة إلى 
أنهم يستطيعون تقييم الطلب وكفاءة عمليات سلسلة التوريد. كما تستطيع شركات ال منتجات 
الاستهلاكية تحديد الاحتياجات الخاصة للعملاء ومواقع شكاوى العملاء وتتبعهم بسهولة وصولًا 
إلى المنتجات. ويمكن لمندوبي المبيعات تحقيق أهدافهم البيعية من خلال تحليل جغرافيتهم. 

وتعد شركة ٤8۸!‏ (ه٠ء.1إءه)‏ هي الشركة الرائدة في السوق في توفير بيانات أنظمة ال معلومات 
الجغرافية؛ حيث تقوم ESRI‏ بترخيص برنامج 476615 الخاص بها لآلاف العملاء بما في ذلك 


vye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


التجاريون» والحكومة: والجيش. وقد يستغرق الأمر كتابًا أو أكثر لتوضيح تطبيقات قاعدة بيانات 

أنظمة المعلومات الجغرافية لشركة 85181 وبرامجها! وهناك شركة أخرى 525( grindgis.com‏ 

تحدد أكثر من ٠١‏ فئة من تطبيقات أنظمة ال معلومات الجغرافي ة/١0ء.ءنعhttp://grind(.‏ 

eJUssblog/gis-applications-uses) GIS‏ بعض الأمثلة التي م نذكرها بعد وتشمل ما ياي: 

- التطبيقات الزراعية: فمن خلال الجمع بين كل من ال موقع» والطقس. والتربة» والبيانات المرتبطة 
با محاصيل» هكن التخطيط بدقة عالية لتطبيقات الري والأسمدة. وتتضمن الأمثلة على ذلك 
بعض الشركات مثل شركة by gaz legio JSS) sensefly.com 4 Såg sstsoftware.com‏ 
أنظمة المعلومات الجغرافية 615 وأحدث المعلومات التي جُمِعَتَ من خلال طائرات بدون 
طيار وتقنيات أخرى ناشئة). 

- تحليل الجريمة: إن ربط بيانات الجرية بما في ذلك تاريخ الجريمة» ووقتهاء ونوعها مع بيانات 
أنظمة المعلومات الجغرافية يوفر رؤى ثاقبة لأماط الجرهة وموظفي الشرطة. 

- التنبؤ بانتشار المرض: من أوائل أمثلة التحليلات الوصفية المعروفة تحليل تفشي وباء الكوليرا 
في لندن عام .۱۸0٤‏ خطط الدكتور 5001 01112[ حالات الكوليرا على خريطة واستطاع دحض 
النظرية التي ترى أن تفشي وباء الكوليرا سببه سوء الهواء. فقد ساعدته الخريطة على أن يحدد 
بدقة أن سبب التفشي يرجع إلى بثر ماء سيئة. )2013 (55a ss 38s (TheGuardian.com,‏ 
كبيرًا من الحاجة إلى تخطيط الخرائط يدوي اء غير أن الفكرة المتعلقة بالقدرة على تتبع تفشي 
الأمراض ومن ثم التنبؤ بهاء مثل الأنفلونزا باستخدام أنظمة المعلومات الجغرافية 615 والبيانات 
الأخرى أصبحت مجالًا رائدًا في حد ذاته. وقد قدم الفصل السابع مثالًا على استخدام بيانات 
وسائل التواصل الاجتماعي مع بيانات أنظمة المعلومات الجغرافية لتحديد اتجاهات الأنفلونزا. 


وبالإضافة إلى ذلك: تستطيع امنظمات باستخدام ذكاء ا موقع» أن تقوم بتغطية الطقس والآثار 
البيئية بشكل سريع وتوقع مستوى التأثير على عمليات الأعمال المهمة. ومع التقدم التقنيء يتم 
الآن إدراج البيانات الجغرافية المكانية مباشرةً في مستودعات بيانات المؤسسة:» وتقوم تحليلات 
قاعدة البيانات التي تعتمد على ال موقع بتمكين المنظمات من إجراء العمليات الحسابية المُعقدة 
بكفاءة عالية والحصول على رؤية واحدة لجميع البيانات الموجهة مكانيّاه وكشف الاتجاهات 
ا مختبئة والفرص الجديدة. فمثلاء يدعم مستودع البيانات الخاص ب تيراداتا ميزة البيانات 
الجغرافية المكانية معتمدًا على المعيار 501:/1121. ويتم رصد ميزة الجغرافيا المكانية كنوع 
بيانات هندسي جديد يُسمى ST_GEOMETRY‏ وهو يدعم مجموعة كبيرة من الأشكال من 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري v‏ 


الفصل الثامن 


نقاط بسيطةء وخطوط وينحني إلى ا مضلعات المعقدة في تمثيل المناطق الجغرافية» وهم يقومون 
بتحويل البيانات غير المتداخلة الخاصة مواقع أعمالهم التشغيلية من خلال دمج إحداثيات 
خطوط الطول والعرض. ويتم دعم هذه العملية الخاصة بالترميز الجغرافي بسهولة من قبل 
شركات الخدمات Jis‏ شركة NAVTEQ‏ وشركة 4135 1816, والتي تحافظ على قواعد بيانات 
عالية للعناوين ذات الخصائص الجغرافية المكانية والاستفادة من أدوات تنظيف العناوين مثل 
-Trilliums Informatica‏ واللتان تدعمان رسم خرائط الإحداثيات ال مكانية للعناوين كجزء من 
وظائف الاستخراج» والتحويل» والتنزيل. 
وتقوم المنظمات عبر مجموعة متنوعة من قطاعات الأعمال باستخدام التحليلات الجغرافية 
المكانية. وسنقوم فيما يلي باستعراض بعض الأمثلة؛ حيث تقدم حالة عملية (6-8) مثالًا على كيفية 
استخدام المعلومات التي تستند إلى الموقع في اتخاذ قرارات اختيار الموقع في توسيع رقعة الشركة. 
وتوضح حالة عملية (0-8) تطبيقًا آخر والذي يتجاوز مجرد قرار الموقع. 
حالة عملية ٤-۸‏ 
كما اوه تستخدم التحليلات المكانية لتوفير الوقت في قرارات الموقع 
يعد 5م011 6686 أكبر وأسرع صالونات الشعر في العام نمؤًا وله أكثر من ٠٠٠١‏ فرع 
ما بين الولايات المتحدة الأمريكية وكندا. يعتمد نجاح 5م011 61686 في منح حق الامتياز 
للغير على إستراتيجية نمو قائمة على افتتاح فروع جديدة بشكل سريع في المواقع والأسواق 
Clips cal. 4 uL‏ 6768 بحاجة إلى تحليل المواقع بناءً على متطلبات قاعدة العملاء 
ا محتملة: والاتجاهات الدمموغرافية: وأثر المبيعات على حقوق الامتياز القائمة بالفعل 
في اللموقع المستهدف. ومن الأهمية بمكان في هذا الصدد اختيار الموقع الجيد. وقد 
استغرقت العمليات الحالية وقنًا طويلًَا لتحليل موقع واحد وعدد هائل من العمالة 
يتطلب موارد تحليل مكثفة لتقييم البيانات بشكل يدوي من مصادر البيانات المتعددة. 
ومع آلاف المواقع التي يتم تحليلها في كل عام كان التأخير ينذر بخطر خسارة 
المواقع الأولية لحساب المنافسين كما كان يبرهن على تكلفتها الباهظة؛ فاستعانت 
Gre Clips‏ مقاولين خارجيين للتغلب على مشكلة التأخير. وقامت الشركة بإنشاء 
تطبيق سير عمل اختيار الموقع لتقييم أماكن الفروع الجديدة باستخدام الإمكانيات 
التحليلية للجغرافيا المكانية التابعة لشركة ×رعه†ا4. وأي موقع جديد يتم تقييمه من 
خلال وقت القيادة التقريبية إليه وسهولة خدمة جميع العملاء الموجودين في محيط 


vrr‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


شبكة 5م011 1626©. كما مكّن الحل القائم على 4161776 في تقييم كل موقع جديد بناءً 
على البيانات الديموغرافية والسلوكية للمستهلكينء والتوافق مع ملفات تعريف عملاء 
ls gwll Great Clips‏ ال محتمل لإيرادات الموقع الجديد على المواقع الموجودة من 
قبل. وكنتيجة لاستخدام فنيات التحليل القائمة على الموقع. استطاعت ومنآن Great‏ 
تقليل وقت تقييم المواقع الجديدة بنسبة 50* تقريبًاء وتم إجراء التحليل المكثف 
للعمالة بصورة آلية وتم تطويره في تحليل جمع البيانات» ورسم الخرائط وتطبيق إعداد 
التقارير التي يمكن استخدامها بسهولة من قبّل مديري العقارات غير الفنيين. بالإضافة 
إلى ذلك تمكنت الشركة من تنفيذ تحليلات 
لا تستغرق العملية بأكملها الآن سوى بضع دقائق. 


أسئلة للمناقشة: 





3Great Clips كيف يتم استخدام تحليلات الجغرافيا المكانية في‎ -١ 


۲- ما هي المعايير التي ينبغي على الشركة مراعاتها عند تقييم أماكن المواقع 
الجديدة في ال مستقبل؟ 
-٠‏ هل تستطيع التفكير في تطبيقات أخرى قد تستفيد من بيانات الجغرافيا المكانية؟ 
Source: Adapted from Alteryx.com. (n.d.). Great Clips. alteryx.com/sites/default/‏ 
files/resources/files/case-study-great-chips.pdf (accessed August 2016).‏ 
حالة عملية ٥-۸‏ 
ستاربكس تستغل نظم المعلومات الجغرافية (615) وتحليلاتها لتنمو في کل أنحاء العام 
يعتبر أحد أهم التحديات التي تواجه أي منظمة تسعى للتوسع هو تحديد موقع 
فرعها التاليء وهذا ما تواجهه ستاربكس. ولتحديد مواقع فروع جديدة» يقوم أكثر من 
٠‏ موظف في ستاربكس (يشار إليهم كشركاء) في 10 دولة باستخدام تخطيط السوق 
القائم على 45615 وحل ذكاء الأعمال الذي يسمى 44135؛ حيث تمد 40185 الشركاء 
بمهام سير العمل والتحليل ومعلومات عن أداء الفرع بحيث يمكن للشركاء المحليين في 
امجال اتخاذ القرارات عند تحديد فرص أعمال جديدة. 
وكما ذكرت تقارير مصادر متعددةء يستخدم صانعو القرار ا محليين 44195 لفهم 
الاتجاهات السكانية والطلب. فيوجد في الصين مثلاء أكثر من 1٠١‏ فرع ل ستاريكس» 
وتقوم الشركة بافتتاح فرع جديد كل يوم تقريبًا. وفي سبيل تحديد موقع الفرع التالي 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vr‏ 


الفصل الثامن 


تكون الشركة بحاجة لكثير من ا معلومات عن المناطق التجارية وتجمعات بيع التجزئة 
وال مولدات والحركة المرورية وا معلومات الدموغرافية. وبعد تحليل السوق والحي 
الجديدين. يستطيع المدير الحصول على نظرة مكبرة لمواقع محددة في أي منطقة في 
adl‏ ومن ثَّمّ تحديد ثلاثة أبراج مكتبية جديدة يمكن أن تكتمل في غضون شهرين 
مثلًا. وبعد عرض هذه المنطقة على الخريطة» يمكن إنشاء نافذة لسير العمل والتي 
سوف تساعد المدير على متابعة حركة الموقع الجديد بدءًا با موافقة» مرورًا بالتصاريح» 
ثم التشييد, وأخيرًا الافتتاح. 


ويمكن أيضًا إدارة عمليات الطلب وسلاسل التوريد بشكل أفضلء وذلك من خلال 
تكامل بيانات الطقس مع البيانات المحلية الأخرى. وتسعى ستاربكس لتكامل أنظمة 
أعمالها مع حلول نظم (615) الخاصة بها في خدمات الويب للحصول على رؤية جديدة 
للأعمال في جميع أنحاء العام. فمثلًاء تقوم ستاربكس بدمج توقع بيانات درجة الحرارة 
الحقيقية التي تتنبأ بها أرصاد. ويمكن أن تساعد هذه البيانات المتوقعة لدرجات 
الحرارة في تمركز الجهود التسويقية. ومع اقتراب الأسبوع شديد الحرارة في ممفيس» 
يمكن بلحللي ستاربكس اختيار مجموعة من بيوت القهوة والحصول على معلومات 
مفصلة عن أنماط الطقس ف الماضي وال لمستقبلء بالإضافة إلى خصائص الفرع. ويمكن 
استخدام هذه ا معرفة لتصميم ترويج محلي لفرابتشينو 1705ءعنامم8:8. فمثلًاء کن 
مساعدة ستاربكس على توقع ما سيطلبه عملاؤه لأسبوع مقدماء 

وللأحداث الكبيرة أيضَا أثرٌ على بيوت القهوة. فعندما نزل 10١‏ ألف شخص في 
موكب San Diego Å mS‏ قام السقاة المحليون بخدمة الكثير من العملاء. ولضمان 
أفضل تجربة ممكنة للعميل» استخدمت ستاربكس هذه ال معرفة بالحدث المحلي 
لتخطيط طاقم العمل والمخزون في مواقع قريبة من الموكب. 

أسئلة للمناقشة: 


-١‏ ما هو نوع امعلومات الدهوغرافية ومعلومات 618 التي قد تتعلق بقرار تحديد 
موقع الفرع؟ 

-Y‏ من المعلوم أن ستاربكس تشجع عملاءها على استخدام تطبيق الجوال الخاص 
بها. ما هو نوع المعلومات التي ربما تلتقطها الشركة من التطبيق لمساعدتها في التخطيط 
الأفضل للعمليات؟ 


vye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


- هل إتاحة 111-51 بالمجان في فروع ستاربكس ستقدم أي معلومات إلى ستاريكس 

من أجل تحليلات أفضل؟ 
Sources: Digit.HBS.org (2015). Starbucks: Brewing up a data storm! https://digit.hbs.‏ 
org/submission/Starbucks-brewing-up-a-data-storm/(accessed August 2016); Wheeler,‏ 
C. (2014) Going Big with GIS. http://www.esri.com/esri-news/arcwatch/0814/‏ 
going-Big-with-gis (accessed August 2016); Blogs.ESRLcom. From customers to‏ 
CxOs, Starbucks delivers world-class service. (2014). https://blogs.esri.com/esri/‏ 
ucinsider/201429/07//Starbucks/(accessed August 2016).‏ 


وبالإضافة إلى تطبيقات تحليل معاملات التجزئة التي أبرزناها هناء فهناك تطبيقات أخرى 
متعددة للجمع بين المعلومات الجغرافية وبين البيانات الأخرى التي يتم إنشاؤها من قبل المنظمة. 
فعلى سبيل المثالء غالبًا ما تنتج عمليات الشبكة وشركات الاتصالات كميات هائلة من البيانات 
اليوم. وتسطيع القدرة على تحليل البيانات بسرعة مع مستوى عالٍ من التفاصيل الخاصة بالموقع 
أن تحدد بشكل أفضل الاضطراب عند العميل ومن ثم تقوم بالمساعدة في صياغة إستراتيجيات 
خاصة با مواقع من أجل زيادة كل من الكفاءة التشغيليةء وجودة الخدمة: والأرباح. 

ويستطيع التحليل الجغرافي المكاني أن يكن شركات الاتصالات من رصد المعاملات اليومية من 
الشبكة لتحديد المناطق الجغرافية التي تعاني من فشل عدد كبير من محاولات الاتصال الخاصة 
بالصوت, أو البيانات: أو adl‏ أو الإنترنت. وتستطيع التحليلات أن تساعد في تحديد الأسباب 
الدقيقة اعتمادًا على الموقع والانتقال إلى عميل فردي من أجل توفير خدمة عملاء أفضل. ويمكنك 
أن تلمس ذلك أثناء العمل عن طريق إكمال تمرين الوسائط المتعددة التالي. 
تمرين الوسائط المتعددة في تحليلات تستخدم التحليلات الجغرافية المكانية: 

تشتمل شبكة جامعة تيراداتا على فيديو 851 في حالة فشل مكايلات الهاتف المحمول. يُرجى مشاهدة 
الفيديو المتاح على موقع يوتيوب عبر |لرqlط http://www:teradatauniversitynetwork. :Jlill‏ 
-com/Library/Items/BSI-The-Case-of-the-Dropped-Mobile-Calls./‏ 

وتطلق شركة اتصالات خطًا جديدًا من الهواتف الذكية وتواجه مشاكل مع انخفاض المكامات. 
وتتعرض عملية الطرح الجديد إلى مشاكلء وتعتبر المنطقة الشمالية الشرقية هي ا منطقة الأكثر 
تضررًا حيث يقومون بمقارنة تأثيرات المكالمات المفقودة على أرباح المنطقة الجغرافية. وتقوم 
الشركة بإيجار 851 لتحليل المشاكل الناجمة عن عيوب الهواتف الذكية» وتغطية البرج» ومواطن 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vyo‏ 


الفصل الثامن 


خلل البرمجيات. وتنقسم بيانات المنطقة الشمالية الشرقية بأكملها إلى مجموعات جغرافية, 
وتقوم الشركة بحل المشكلة من خلال تحديد بيانات العملاء الفردية. ويستخدم فريق 1851 
التحليلات الجغرافية المكانية لتحديد المواقع التي تؤدي فيها تغطية الشبكة إلى انخفاض المكالمات 
وتقترح تثبيت بضعة أبراج إضافية في موقع العملاء غير الراضين عن الخدمة. 

وبعد اكتمال الفيديو» يمكنك الاطلاع على كيفية إعداد التحليل عبر: 


slideshare.net/Teradata/bsi- Teradata-the-case-of-the-dropped-mobile-calls. 


وتقدم هذه النزهة من الوسائل المتعددة مثالا على مجموعة من التحليلات الجغرافية المكانية 
بجانب تحليلات البيانات الضخمة التي تساعد في اتخاذ القرارات بشكل أفضل. 


ذكاء الموقع الفوري: 


تقوم العديد من الأجهزة المستخدمة بواسطة المستهلكين والمهنيين بإرسال معلومات الموقع 
الخاصة بهم بوتيرة ثابتة. وتقوم السيارات والحافلات وسيارات الأجرة وأجهزة الجوال والكاميرات 
وأجهزة التنقل الشخصية ببث إشارات لمواقعها باستخدام تقنيات تحديد المواقع المتصلة بالشبكة 
مثل -cell tower triangulations Wi-Fis (GPS)‏ 

ويستخدم الملايين من المستهلكين وأصحاب الأعمال الأجهزة الممكّنة بالموقع للعثور على خدمات 
dio jS‏ وموقع الأصدقاء والعائلة والتنقلء وتعقب الأصول والحيوانات الأليفة» والاشتراك في الألعاب 
الرياضية: والهوايات. وقد أدى هذا الاندفاع القوي في الخدمات الممكنة بالموقع إلى قاعدة بيانات 
ضخمة من المعلومات التاريخية ومعلومات الموقع المتدفقة أولًا بأولء وهي بالتأكيد متفرقة وغير 
مفيدة في حد ذاتها. حيث تقدم مجموعة البيانات الآلية التي تم تمكينها من خلال التقاط الهواتف 
الخلوية ونقاط الوصول الساخنة إلى 1171-11 بُعدًَا جديدًا مثيرَا للاهتمام في أبحاث السوق غير 
المتداخلة, وجمع البيانات» وبالطبع» التحليل الدقيق يلثل هذه المجموعات الضخمة من البيانات. 

ويمكن من خلال التحليل والتعلم من هذه الأنماط واسعة النطاق للحركة: أن يتم تحديد 
فئات متميزة من السلوكيات في سياقات محددة. ويسمح هذا النهج لأصحاب الأعمال بفهم أنماط 
عملائهم بشكل أفضل واتخاذ قرارات أقوى بشأن العروض الترويجية والتسعير وما إلى ذلك. كما 
يمكن من خلال تطبيق الخوارزميات التي تقلل من أبعاد بيانات الموقع» أن يتم تمييز الأماكن وفقًا 
للنشاط والتنقل بينها. ومن الكميات الهائلة لبيانات الموقع ذات الأبعاد المرتفعة. تكشف هذه 
الخوارزميات عن اتجاهات ومعان وعلاقات تنتج في النهاية تمثيلات سهلة الفهم للبشرء ثم يصبح 


v‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


بعد ذلك من الممكن استخدام مثل هذه البيانات لعمل تنبؤات ذكية تلقائيًا وإيجاد أوجه تطابق 
وتشابه مهمة بين الأماكن والأفراد. ويظهر تطبيق التحليلات القائمة على الموقع في تطبيقات 
التسويق الموجهة بالمستهلك. Quiznos p sög‏ وهومطعم خدمات سريعة»ء باستخدام منصة 
0115 5615 لتحليل مسارات المواقع لمستخدمي الجوال بناءً على البيانات الجغرافية المكانية 
المتحصل عليها من نظام (685) والعملاء المستهدفين من الذكاء التقني باستخدام الكوبونات. 
انظر حالة عملية (1-۸). توضح هذه الحالة الاتجاه الحديث في مجال بيع التجزئة حيث تتطلع 
الشركات إلى رفع كفاءة الحملات التسويقيةء ليس فقط من خلال استهداف كل عميل بناءً على 
موقعه الحالي» ولكن عن طريق استخدام تحليلات تنبؤية أكثر تطورًا في الوقت المناسب على 
خصائص المستهلكين السلوكية لإيجاد المجموعة الصحيحة من المستهلكين للحملات الإعلانية. 
حالة عملية 5-8 
مطعم 0112205 يستهدف عملاء للسندويشات التي يقدمها 
قام مطعم ١2۸0ا‏ الحاصل على حق امتياز للخدمة السريعة» بتنفيذ حملة 
استهداف أجهزة الجوال القائمة على الموقع والتي استهدفت مستهلكين ذوي دهاء تقني 
وغير متفرغين من مدينة بورتلاندء بولاية أوريجون. واستخدمت الحملة منصة 6ومء8 
015 والتي قامت بتحليل مسارات مواقع مستخدمي الجوال لفترات زمنية مفصّلة, 
وقامت بإنشاء ملفات شخصية مجهولة بناءً على السمات السلوكية لعادات التسوق. 
وبتطبيق التحليلات التنبؤية على الملفات الشخصية للمستخدمينء قام مطعم 
5 باستخدام الاستهداف السلوي المبني على الموقع لتقليل خصائص ال مستخدمين 
المحتمل تناولهم للأكل في مطعم الخدمة السريعة أكثر من غيرهم. واستمرت هذه 
الحملة الإعلانية لمدة شهرين - نوفمبر وديس مبر 7١17‏ - واستهدفت فقط العملاء 
الذين تتراوح أعمارهم بين 1٨‏ و٠٤٠‏ عامًا وا محتمل تواجدهم في مطاعم الخدمة السريعة 
خلال الثلاثين يومًا السابقة» في -Quiznos gzh J> Li äs boya Ña Y oga‏ 
واستخدمت إعلانات الجوال ذات الصلة بالكوبونات المحلية بناءً على موقع العميل. 
وقد نتج عن هذه الحملة أكثر من ۴,۷ مليون عميل جديد وزيادة بنسبة ۲١‏ في 
عمليات استرداد الكوبونات داخل منطقة بورتلاند. 
أسئلة للمناقشة: 


-١‏ كيف يمكن أن تساعد التحليلات القائمة على الموقع تجار التجزئة في استهداف العملاء؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vyv‏ 


الفصل الثامن 


"'- قم بالبحث عن تطبيقات مشابهة للتحليلات قائمة على الموقع في مجال بيع التجزئة. 
Source: Adapted from Mobilemarketer.com (2013). Quiznos sees 20pc boost in‏ 


coupon redemption via location-based mobile ad campaign. mobilemarketer.com/ 


cms/news/advertising/14738.html (accessed August 2016). 

ولا زال هناك امتداد آخر للتحليلات القانئمة على الموقع وهو استخدام الواقع المعزز. في 
V-VI ple‏ ظهرت ضجة سوقية اسمها Pokémon GO‏ وهي لعبة قائمة على الواقع معززة 
باستشعار الموقع حيث تشجع المستخدمين على المطالبة بأشياء افتراضية من المواقع الجغرافية 
المنتقاة. فيستطيع المستخدم أن يبدأ من أي مكان في المدينة ويسير وفقًا لعلامات على التطبيق 
للوصول إلى بند معين. وتكون الأشياء الافتراضية مرئية من خلال التطبيق عندما يوجه المستخدم 
كاميرا الهاتف باتجاه أي منها. ويستطيع المستخدم بعد ذلك أن يطالب بذلك الشيء. وتعد 
تطبيقات الأعمال لمثل هذه التقنيات أيضًا حديثة الظهور. على سبيل المثال» يوجد تطبيق يسمى 
Candybar‏ يسمح هذا التطبيق لأصحاب الأعمال بوضع هذه الأشياء الافتراضية على خريطة 
باستخدام خرائط ©[ع6008. كما يمكن باستخدام 171297 b glg Laa Google Street‏ 
الأشياء بمزيد من الدقة» وبمجرد أن يتم تنسيق كل البنود الافتراضية مع المعلومات والموقع» يصبح 
بإمكان صاحب العمل أن يبث بنودًا مرئية للمستخدم بشكل فوري. LÏ Candybar åg LS‏ 
تحليلات استخدام الأعمال لتمكين استهداف أفضل للأشياء الافتراضية. ويعمل جانب الواقع 
الافتراضي لهذا التطبيق على تحسين تجربة المستخدمينء بتوفير بيئة ”ألعاب” لهم في الحياة 
الواقعية. وفي نفس الوقت» يوفر منصة تسويق قوية لأصحاب الأعمال للوصول إلى عملائهم. 

وكما هو واضح من هذا القسم» فقد تصبح التحليلات القائمة على الموقع والتطبيقات الناتجة 
عنها هي أهم واجهة للمنظمات في المستقبل القريب. وكان استخدام البيانات التشغيلية أو 
التسويقية من قبل المنظمات واحدًا من الأفكار الشائعة في هذا القسم. وسوف نقوم لاحقًا 
باستكشاف تطبيقات التحليلات التي تستهدف المستخدمين بشكل مباشر وفي بعض الأحيان 
تستغل ميزة معلومات الموقع. 


لقد أوجد النمو الهائل في صناعة التطبيقات لمنصات الهواتف الذكية Android iOS)‏ 
Windowss‏ 55 تبعها) وفي استخدام التحليلات فرضًا كبيرة لتطوير التطبيقات حيث يستخدم 
المستهلكون التحليلات دون إدراك. وتختلف هذه التطبيقات عن الفئة السابقة في أنها معنية 


VYA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


بالاستخدام المباشر للمستهلكء بدلا من المنظمة التي تحاول التنقيب في بيانات المستخدم المتعلقة 
بالاستخدام / بالشراء لإنشاء ملف تعريف لتسويق منتجات أو خدمات محددة. ووفقًا للتنبؤات» 
تعمد هذه التطبيقات إلى تمكين المستهلكين من اتخاذ قرارات أفضل عن طريق استخدام تحليلات 
محددة. ونستعرض فيما يلي مثالين على ذلك. 

يعمل 111826 - وهو تطبيق ويب اجتماعي - على مساعدة المستخدمين في تحديد مسار 
التنقل وتنبيه المستخدمين بالمشكلات المحتملة مثل الحوادث ونقاط التفتيش وأجهزة مراقبة 
السرعة ومواقع أعمال البناء على الطريقء وذلك بناءً على مدخلات مستخدمين آخرين. وقد 
أصبح 17826 أحد أكثر تطبيقات التنقل انتشارًا. وقد حصلت 600816 على هذا التطبيق منذ 
بضع سنوات» وعملت على تحسينه. ويعد هذا التطبيق مثالا على تجميع المعلومات التي ينشئها 
ا مستخدم وجعلها متاحة للعملاء. 

تسمح الكثير من التطبيقات للمستخدمين بإرسال الاستعراضات والتصنيفات لأصحاب الأعمال 
والمنتجات وما إلى ذلك ومن ثّمّ تقديمها للمستخدمين في صورة متكاملة لمساعدتهم في وضع خيارات. 
ويمكن تعريف هذه التطبيقات أيضًا كتطبيقات مبنية على بيانات اجتماعية تستهدف المستهلكين 
حيث يقومون بإنشاء البيانات. ويعتبر ماعلا أحد التطبيقات الأكثر رواجًا بين تطبيقات الفئة. 

وتم نشر تطبيق آخر مرتبط بالنقل يستخدم التحليلات التنبؤية في بيتسبيرج» بنسلفانيا. وقد 
تم تطويره بالتعاون «Carnegie Mellon áxlz ga‏ ويشمل هذا التطبيق إمكانيات تنبؤية لتقدير 
توافر مواقف السيارات. ويقوم 2011:2011 بتوجيه السائقين إلى المناطق التي تتوفر فيها مواقف 
للسيارات. فهو يقوم بحساب عدد أماكن وقوف السيارات المتاحة في ٠١‏ مواقف والتي تتجاوز 01.١‏ 
مساحة و٥۲‏ من مواقف السيارات في وسط مدينة بيتسبيرج. ويتم تحديث المساحات المتاحة 
كل ٠١‏ ثانيةء مما يحفظ تواجد السائق بالقرب من الأماكن المتاحة قدر الإمكان. وبالاعتماد على 
الطلب التاريخي والأحداث الحاليةء يكون التطبيق قادرًا على التنبق بتوفر مواقف للسيارات وتوفير 
معلومات عن المساحة التي ستكون متاحة مع الوقت الذي يصل فيه السائق إلى المكان المقصود. 
وتستخدم الخوارزمية الأساسية للتطبيق بيانات حول الأحداث الجارية حول المنطقة - على سبيل 
JELI‏ لعبة كرة السلة - للتنبؤ بزيادة في الطلب على أماكن وقوف السيارات في وقت لاحق من ذلك 
اليوم» وبالتالي توفير وقت مين للمسافرين للبحث عن أماكن وقوف السيارات في المدينة المشغولة. 

م تكن نشأة التطبيقات القائمة على التحليلات فقط للمرح والصحة: ولكنها ظهرت كذلك 
لتعزيز إنتاجية الفرد. فعلى سبيل المثالء تتواجد التطبيقات 01026 و0131 وغيرها في مكان 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vya‏ 


الفصل الثامن 


واحد. ويقوم تطبيق 01026 بإدارة صناديق الرسائل الواردة للعديد من حسابات البريد 
الإلكتروني بجانب حسابات أخرى لوسائل التواصل الاجتماعي. فهو يقوم بعمل تكامل بين 
الشبكات الاجتماعية وجهات اتصال البريد الإلكتروني لمعرفة أي من جهات الاتصال تكون أكثر 
أهمية من غيرها ويقوم بإعطائها درجات» بحيث تحصل جهات الاتصال المهمة علي درجة أعلى. 
فيتم عرض رسائل البريد الإلكتروني ذات الدرجات الأعاى أولا. وبالتالي esi‏ بإبعاد البريد الأقل 
أهمية وغير ذي الصلة. ويعمل 01026 على تخزين سياق كل محادثة لتوفير الوقت عند العودة 
مكالمة معلقة. ويتم تنظيم جهات الاتصال في مجموعات بناءً على عدد مرات تكرار تفاعلهاء مما 
يساعد المستخدمين على البقاء على اتصال مع الأفراد الذين قد يفقدون الاتصال بهم. ويمكن 
للمستخدمين وضع درجات 01026 للأفراد الذين يريدون الحصول على اتصال بهم والعمل على 
تحسين هذه الدرجة. ويقوم 01026 برفع درجة كلما حدثت محاولة اتصال. فعلى سبيل المثال» 
عند فتح أي بريد إلكتروني يوفر 01026 عدة خيارات» مثل ”الآن“» ”اليوم“ ”غدًا“ ”الأسبوع 
القادم“: والتي تُذكّر المستخدم تلقائيًا أن يبدأ الاتصال وفقًا للجدول الزمني. ويعمل هذا كتذكير 
للرجوع إلى رسائل البريد الإلكتروني في وقت لاحقء دون نسيانها أو وضع علامة ”غير مقروء“عليهاء 
والتي غالبًا ما تؤدي إلى ازدحام صندوق الوارد. ولأن 01026 الآن أصبح مستهدقًا كتطبيق إنتاجي 
للأعمالء تعتبر أسعاره حاليًا أكبر من إمكانيات المستهلك. 

وكما يتضح من هذه الأمثلة للتطبيقات المرتكزة على المستهلك» تبدأ التحليلات التنبؤية 
في تمكين تطوير البرمجيات التي يستخدمها المستهلك مباشرة. وتقذر مجلة 565666 517211 
(wsj.com/apps)‏ حجم صناعة التطبيقات الذي وصل بالفعل لقيمة ١50‏ مليار دولار بنمو 
متوقع أكبر. ونحن نؤمن بأن نمو التطبيقات التحليلية الموجهة بالممستهلك سيستمر ويصنع 
الكثير من فرص الأعمال الحرّة لقراء هذا الكتاب. 

ويتمثل أحد أهم المخاوف من استخدام هذه التقنيات في فقدان الخصوصية. فإذا استطاع 
أي شخص تتبع حركة انتقال الهاتف الخلويء تكون خصوصية هذا العميل مشكلة كبيرة؛ إذ يدعي 
بعض مطوري التطبيقات أنهم بحاجة فقط إلى جمع معلومات تدفق مجمعةء وليس المعلومات 
سهلة التحديد بشكل فرديء في حين تظهر الكثير من القصص في وسائل الإعلام تسلط الضوء على 
اختراقات لهذا المبدأ العام. ويجب أن يكون لدى كل من المستخدمين والمطورين لهذه التطبيقات 
الوعي التام بالأثر الضار الناجم عن منح معلومات خاصة فضلًا عن جمع مثل هذه المعلومات. 
وفي القسم التالي سوف نناقش هذه القضية بشيء من التفصيل. 


vw‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


أسئلة مراجعة على القسم :٤-۸‏ 
-١‏ كيف تستخدم التحليلات التقليدية البيانات القائمة على الموقع؟ 
۲- كيف هكن أن تساعد ال مواقع اممكودة جغرافيًا في اتخاذ قرار أفضل؟ 
-Y‏ ما هي القيمة المضافة بواسطة التحليلات الجغرافية المكانية؟ 
-٤‏ قم باستكشاف استخدام التحليلات الجغرافية المكانية بشكل أكبر من خلال التحقق من 
استخدامها عبر قطاعات متنوعة مثل تتبع التعداد الحكوميء والتسويق للمستهلك» وما إلى ذلك. 
5- قم بالبحث على الإنترنت عن تطبيقات أخرى للتطبيقات التحليلية الموجهة بالمستهلك. 
1- كيف يمكن للتحليلات القائمة على الموقع أن تساعد المستهلكين الأفراد؟ 
- قم باستكشاف المزيد من تطبيقات النقل التي قد تستخدم تحليلات قائمة على الموقع. 
8- ما هي التطبيقات الأخرى التي يمكنك تخيلها إذا كنت قادرًا على الوصول إلى بيانات موقع الهاتف الخلوي؟ 
0-8 القضايا القانونية. والخصوصية. والأخلاقية: 
لقد تطورت تطبيقات علم البيانات» والتحليلات: والحوسبة الإدراكية: بالإضافة إلى الذكاء 
الاصطناعي في إمكانية الوصول إليها وانتشارهاء وقد أدى هذا التطور إلى تأثر كل شخص بهذه 
التطبيقات. ومجرد إمكانية تحقيق شيء من خلال التقنية» Golis Éi alez Y‏ أو قانونيًه أو 
أخلاقيًا. ويجب أن يكون متخصصو علم البيانات والمديرون على وعي تام بهذه المخاوف. وترتبط 
العديد من القضايا القانونية» والخصوصية: والأخلاقية المهمة بالتحليلات. ونقدم هنا أمثلة معبرة 
ومصادر فقط. وعادةً ما تكون وسائل الإعلام المنتشرة حريصة للغاية على الإبلاغ عن مثل هذه 
الانتهاكات للسلوك القانوني والأخلاقي. لذلك؛ فإن هذا القسم هو أحد الأقسام الذي قد يمكنك 
العثور فيه على المزيد من الأمثلة الحديثة عبر الإنترنت. وكما أشرنا في الفصل الأول» فإننا نهدف 
هنا فقط لإطلاعك على هذه القضايا. وينبغي على فرّق الفصل الخاص بك أن تحدد حالات 
أحدث وتقوم بمناقشة هذه الحالات. 
القضايا القانونية: 
قد يؤدي إدخال التحليلات إلى تفاقم مجموعة كبيرة من القضايا القانونية التي لها صلة فعلية 
بأنظمة الحاسب. وعلى سبيل المثالء فإن الأسئلة المتعلقة با مسؤولية عن أعمال المشورة المقدمة 
من الآلات الذكية بدأت تؤخذ بعين الاعتبار. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ww‏ 


الفصل الثامن 


وبالإضافة إلى حل النزاعات حول نتائج بعض التحليلات غير المتوقعة بل وربمما lal‏ فإنه 
قد تظهر قضايا أخرى معقدة, مثل: مَن الذي يتحمل المسؤولية في حالة ما إذا وجدت اممؤسسة 
نفسها مفلسة نتيجة لاستخدام نصيحة تطبيق تحليلي؟ هل ستتحمل المؤسسة المسؤولية لعدم 
اختبار النظام بشكل كاف قبل إسناد قضايا حساسة له؟ هل ستشارك شركات التدقيق والمحاسبة 
في المسؤولية عن الفشل في تطبيق اختبارات تدقيق كافية؟ هل سيكون لمطوري البرمجيات 
الخاصة بالأنظمة الذكية دور في المسؤولية؟ عندما تصبح السيارات ذاتية القيادة أكثر انتشارًاء 
من سيكون المسؤول عن أي ضرر أو تلف عندما تتعطل أجهزة استشعار السيارة أو الشبكة؛ أو 
التحليلات في العمل كما هو مُخطط لها؟ وهناك حالة حديثة تتعلق بحادث سيارة 16518 حيث 
مات السائق بينما أظهرت السيارة أنها في وضع الطيار الآلي «1106م160ه» وقد تقلت هذه القضية 
على الصفحات الأولى من الصُّحُف واطهن القانونية. 
وقدمت الحالة العملية (1-1) أمثلة على استخدام البيانات البديلة في استخدام معلومات 
إضافية من أجل توقعات صائبة بشأن مخرجات الحصيلة المستقبلية» ومبيعات الشركةء وغيرها. 
وعلى الرغم من أن هذه الأدوات اليوم لا تفرض قِيودًا تقليدية على التداول من الداخل نظرًا 
لعدم مشاركة أي شخص داخل الشركة للمعلومات غير العامة: إلا أنه ربما JIS Y‏ هناك مشاكل 
حول الحصول على المعلومات التي تكون غير متاحة للعامة. وقد لاحظ 515168 (2015) أن أي 
تاجر في السوق يستخدم التحليلات والبيانات البديلة لابد أن يكون على علم بقواعد المعلومات 
ا لمفروضة من قبل الهيثات التنظيمية المالية. وعادةً ما تكون الأفكار المستمدة من البيانات 
العامة آمنة نظرًا لعدم الحصول عليها بشكل مباشر من مصادر داخلية. 
تأمل المسائل القانونية المُحددة التالية: 
- ما قيمة رأي الخبير في المجال إذا ما تم تشفير الخبرة في الحاسب؟ 
- من هو المسؤول عن النصيحة (أو المعلومات) الخاطئة التي يقدمها أحد التطبيقات الذكية؟ 
Siad‏ ماذا يحدث إذا صدق الطبيب تشخيصًا غير صحيح شخّصه جهاز الحاسب وقام الطبيب 
على أساسه باتخاذ إجراء تسبب في وفاة أحد المرضى؟ 
- ماذا يحدث لو قام أحد المديرين بإدخال تقييم حكمي غير صحيح في تطبيق تحليلي وكانت 
النتيجة حدوث ضرر أو كارثة؟ 
- من الذي يملك المعرفة في قاعدة اللعرفة؟ 
- هل تملك الإدارة الحق في إجبار الخبراء على المساهمة بخبراتهم؟ 


vv‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


الخصوصية: 

يختلف مفهوم الخصوصية باختلاف الناس. وبشكل عام» فإن الخصوصية هي حقك في أن تنفرد 
بذاتك» كما أنها الحق في أن تتحرر من تدخلات الآخرين غير المعقولة في أمورك الشخصية. ولطاما 
كانت الخصوصية قضية قانونية: وأخلاقيةء واجتماعية في العديد من البلدان» حيث يتم الاعتراف 
بالحق في الخصوصية اليوم في كل ولاية من الولايات المتحدة الأمريكية والحكومة الفيدرالية سواء 
أكان من خلال التشريع» أو بموجب القانون العام. ويمكن تفسير تعريف الخصوصية تفسيًا Bulg‏ 
Ol ae dir‏ المحكمة كانت تتبع في قراراتها السابقة القاعدتين التاليتين بشكل دقيق إلى حد ماء وهما: 
-١‏ أن حق الخصوصية ليس حقًا مطلقًا. فالخصوصية يجب أن تكون متوازنة مع احتياجات المجتمع. 
of -Y‏ حق الجمهور في المعرفة يفوق حق الفرد في الخصوصية. 

وتوضح هاتان القاعدتان سبب صعوبة تحديد وتطبيق قوانين الخصوصية في بعض الأحيان 
(انظر 2005 (Peslak,‏ وتتضمن قضايا الخصوصية عبر الإنترنت خصائص وسياسات محددة. 
وفيما يلي سنناقش أحد المجالات الذي قد تتعرض فيه الخصوصية للخطر. وللتعرف على قضايا 
الخصوصية والأمان في بيئة مستودع البيانات» يمكنك أيضًا الاطلاع على الورقة التي كتبها كل من 
LeClercs Elson‏ )2005(. 


جمع المعلومات عن الأفراد: 


في كثير من الحالات كان التعقيد في عملية جمع المعلومات؛ وفرزهاء وحفظهاء والوصول إليها 
يدويًا في العديد من الوكالات الحكومية: بمثابة وقاية تلقائية ضد إساءة استخدام المعلومات 
الخاصة.. فقد كان الإقدام على انتهاك خصوصية أي شخص ببساطة ÉS Gal‏ ومرهقًاء فضلًا عن 
كونه معقدًا. وقد أنشأ الإنترنت بعدًا جديدًا تمامًا للوصول إلى البيانات واستخدامهاء جنبًا إلى جنب 
مع قواعد البيانات واسعة النطاق. ويمكن استخدام القوة الكامنة في الأنظمة التي يمكنها الوصول 
إلى كميات هائلة من البيانات لأجل مصلحة المجتمع. فمثلًاه من خلال مطابقة السجلات بمساعدة 
جهاز الحاسبء يمكن القضاء على أو الحد من الاحتيال والجريمة وسوء الإدارة الحكومية والتهرب 
الضريبي والغش في الرعاية الاجتماعية وسرقة الدعم الأسري وتوظيف العمال غير الشرعيين» وغير 
ذلك. ولكن ما هو القدر الذي يجب أن يتكلفه الفرد من فقدان الخصوصية بحيث تستطيع 
الحكومة إلقاء القبض على المجرمين بشكل أفضل؟ وينطبق الأمر ذاته على مستوى الشركات. 
فعلى الرغم من أن المعلومات الخاصة بالموظفين قد تساعد في اتخاذ القرارات بشكل أفضلء إلا أن 
خصوصية الموظفين قد تتأثر بهذا الأمر. وهناك قضايا مشابهة تتعلق بالمعلومات الخاصة بالعملاء. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 0 


الفصل الثامن 


الجدير بالذكر أن الآثار المترتبة على الخصوصية على شبكة الإنترنت لا يُستهان بها. ويوسع 
القانون الوطني الأمريكي أيضًا من قدرة الحكومة على الوصول إلى معلومات الطالب والمعلومات 
المالية الشخصية دون أي شبهة في ارتكاب مخالفات» وذلك عبر إثبات أن تلك المعلومات التي 
من المُرجح الحصول عليها لها صلة بالتحقيق الجنافي الجاري (انظر مركز معلومات الخصوصية 
الإلكترونيةء .)۲٠٠٠‏ فقد تم استخدام معلومات الموقع من الأجهزة لتحديد مكان الضحايا وكذلك 
الجناة في بعض الحالاتء ولكن إلى أي حد تكون المعلومات ليست ملكًا للفرد؟ وقد جلب 
اللغط الأخير حول ما تقوم به الولايات المتحدة وغيرها من الدول الأخرى من تسجيل بيانات 
المكالمات الهاتفية» والبريد الإلكتروني» وغيرها من التحركات المرورية الإلكترونية العديد من هذه 
القضايا إلى المقدمة. وبالإضافة إلى ذلك. فقد أدى تسريب المعلومات من الاتصالات الحكومية 
عن طريق 101116215 إلى حدوث عاصفة كبيرة على مدى السنوات القليلة الماضية. وقد أدى 
إفصاح 5201062 80174 مؤخرًاء عن برامج الحكومة الأمريكية لجمع البيانات واستخراج 
هذه المعلومات أيضًا إلى ضجة إعلامية كبيرة حول قضايا انتهاك الخصوصية. وأي بحث في هذه 
الموضوعات سوف يسفر عن الكثير من الروابط ووجهات النظر. وبصفتك محترقًا لعلم البيانات» 
فإنه ينبغي عليك أن تدرك أن مثل هذه القضايا يمكنها أن تُحدث فرقًا كبيرا في سمعة منظمتك. 

وهناك أداتان فعالتان لجمع المعلومات حول الأفراد وهما ملفات تعريف الارتباط وبرامج 
التجسس. وقد بدأت وسائل تسجيل الدخول الأحادي التي تسمح للمستخدم بالوصول إلى خدمات 
متنوعة من مُقَدِم الخدمة تثير بعض نفس ال مخاوف مثل ملفات تعريف الارتباط. وهناك Okas‏ 
s c 155 (MSN 5 Yahoos .Google) Js‏ المستهلكين بشكل دائم إدخال ملف تعريف 
المعلومات مع كلمة مرور واستخدام هذه المعلومات وكلمة المرور بشكل متكرر للوصول إلى 
الخدمات في مواقع متعددة. وقد ذكر النقاد أن مثل هذه الخدمات ينتج عنها نفس الفرص التي 
تنتج عن ملفات تعريف الارتباط لانتهاك خصوصية الفرد. 

وقد يؤدي استخدام تقنيات الذكاء الاصطناعي في الإدارة وتطبيق القوانين واللوائح إلى زيادة 
المخاوف العامة فيما يتعلق بخصوصية المعلومات. وهذه المخاوفء التي نتجت عن القدرات الملموسة 
للذكاء الاصطناعي» سوف تتعين معالجتها في بداية أي محاولة لتطوير الذكاء الاصطناعي 5 4 

هناك العديد من المُستَخدِمين غير مُدركين للمعلومات الشخصية التي يتم تعقبها من خلال 
استخدامهم للهواتف الذكية. وهناك العديد من التطبيقات التي تجمع بيانات المُستخدم من 
خلال تعقب كل هاتف أثناء انتقاله من بّرج خلية إلى آخرء ومن خلال أجهزة تحديد المواقع 


vre‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


والتي تنقل مواقع المُستخدمينء فضلًا عن تجميع البيانات من الهواتف التي تنقل المعلومات عبر 
نقاط اتصال 1871-51. وعلى الرغم من زعم مطوري التطبيقات الأساسيين أنهم دقيقون للغاية 
ويعملون على حماية خصوصية المستخدمينء إلا أنه من المثير للاهتمام ملاحظة مقدار المعلومات 
المتوفرة من خلال استخدام جهاز واحد. وقد حدث جدل مؤخرًا بين كل من شركة Apple‏ 
والحكومة الأمريكية حول طلب حكومة الولايات المتحدة لإلغاء قفل الأيفون (iPhone)‏ ورفض 
شركة آبل القيام بتعديل برامجها من أجل تلبية هذا الطلب. حيث تزعم شركة gei Ul Apple‏ 
معلومات قليلة أو تكاد تكون معدومة حول عملائها من مُستخدمي أيفون. وعلى الجانب الآخرء 
Google 55‏ يجمع الكثير من ال معلومات المفيدة حتى يتمكن من تقديم معلومات استباقية 
للمُستخدمين حول التقويم الخاص بهم والمطاعم اللْفضلة والأنشطة القادمة: وغيرها. كما 
ينبغي على أي مُطور تطبيق تحليلات أن يضع في اعتباره قضايا الخصوصية. 
الأمن الداخلي والخصوصية الفردية: 

على الرغم من أن الكثيرين يعتبرون أن استخدام تقنيات التحليلات مثل استخراج وتفسير 
محتوى المكاممات الهاتفيةء والتقاط صور للأشخاص ف أماكن معينة وتحديدهاء واستخدام 
الماسحات الضوئية لرؤية متعلقاتك الشخصيةء مثابة انتهاك للخصوصية: إلا أن العديد من الناس 
يدركون أن تلك الأدوات التحليلية هي وسيلة فعالة وذات كفاءة لزيادة الأمن» على الرغم من 
تعرْض خصوصية العديد من الأبرياء للانتهاك. 

وتقوم حكومة الولايات المتحدة بتطبيق تقنيات تحليلية على نطاق عالمي في الحرب على 
الإرهاب. ففي العام ونصف الأول بعد أحداث الحادي عشر من سبتمبر ٠٠١٠‏ قامت سلاسل 
محلات السوبر ماركت» ومتاجر مستلزمات تجديد المنازل» وغيرهم من تجار التجزئة بتسليم 
كميات هائلة من سجلات العملاء طوعًا إلى وكالات تنفيذ القانون الفيدراليةء منتهكة في الغالب 
سياسات الخصوصية المعلَنّة. وقد استجاب الكثير من الآخرين لأوامر المحكمة في الحصول على 
معلومات» كما يقتضي القانون. وتملك حكومة الولايات المتحدة الحق في جمع بيانات الشركة 
موجب التشريع الذي تم تمريره بعد أحداث الحادي عشر من سبتمبر .٠٠١١‏ ويقوم مكتب 
التحقيقات الفيدرالي (581) الآن باستخراج كميات هائلة من البيانات» o blis gÍ os É‏ 
أن يُشير إلى وجود مؤامرة إرهابية أو Ag ye‏ 

الجدير بالذكر أن قضايا الخصوصية كثيرة. is‏ لأن الحكومة تحصل على البيانات الشخصية 
للكشف عن أنماط النشاطات المريبة» فهناك احتمال أن تُستّخدم هذه البيانات بشكل غير لائق أو 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vro‏ 


الفصل الثامن 


غير قانوني. ويرى الكثيرون أن مجرد جمع البيانات يُعد انتهاكًا لحريات وحقوق المواطنين. فهم 
يرون ضرورة وجود منظمة رقابة «للإشراف على المراقبين»» للتأكد من أن وزارة الأمن الداخلي 
لاتحصل على البيانات دون داع لذلك. وبدلًا من ذلكء فإنه ينبغي الحصول على البيانات 
والمعلومات التي لها صلة وثيقة بالموضوع فقط والتي يمكن استخراجها لتحديد الأنماط التي يمكن 
أن تؤدي لوقف أنشطة الإرهابيينء وهذه ليست بالمهمة السهلة. 


قضايا تقنية حديثة في الخصوصية والتحليلات: 


يعتمد أكثر مقدمي .Twitters .Facebooks Google Jia Coy okas‏ 555 على 

تحقيق الدخل من إجراءات ال مستخدمين. فهم يفعلون ذلك بطرق مختلفة: غير أن كل هذه 
الأساليب في النهاية تصل إلى ملف تعريف المُستخدم أو تفضيلاته اعتمادًا على استخدامه. ومع 
تزايد مُستخدمي الإنترنت بوجه عام ومُستخدمي الأجهزة المحمولة بوجه خاصء تم تأسيس 
العديد من الشركات لاستخدام التحليلات المتقدمة لتطوير ملفات تعريف المُستخدمين اعتمادًا 
على استخدام الأجهزة والحركةء وجهات الاتصال الخاصة بال مستخدمين. وتحتوي مجلة Wall‏ 
+5166 على مجموعة ممتازة من المقالات تحت عنوان )2016 (WallStreetJournal.com,‏ 
«What They Know»‏ ویتم تحدیث هذه اممقالات باستمرار لتسلیط الضوء على أحدث 
التقنيات وقضايا الخصوصية / الأخلاقية. وقد شملت إحدى الشركات ال مذكورة في هذه السلسلة 
معام (وهي الآن 52« (Towerdata (3a‏ وتدّعي تقنية تقنية fةه1مه۸‏ أنها قادرة على توفير ملف 
تعريف المُسْتَخْدمِ بمجرد معرفة عنوان البريد الإلكتروني الخاص به. ومن الواضح أن تقنيتهم 
ed‏ من جمع معلومات مهمة. وهناك شركة أخرى تهدف إلى تحديد الأجهزة على أساس 
استخدامها وهي 45 -BlueCava‏ والتي اتحدت مؤخرًا مع شركة -(Qualia.com) Qualia‏ 
وتقوم تقنية 81060218 الخاصة بشركة 0113118 بإرفاق ملف شخحي لتتمكن من التعرف على 
المُستخدم باعتباره فرداً واحداً أو عائلة على الرغم من أنهم قد يستخدمون العديد من التليفونات 
المحمولة وأجهزة الحاسب المحمولة. وتقوم كل هذه الشركات بتوظيف التقنيات مثل التجميع 
واستخراج الارتباط لتطوير ملفات تعريف امس تخدمين. ومن المؤكد أن مثل هذه التطبيقات 
التحليلية تثير أسئلة شائكة حول انتهاك خصوصية الس تخدمين. وبالطبع» فإن العديد من 
الشركات التحليلية حديثة الظهور في هذا ا لمجال لدعي احترام خصوصية امْستخدم بيد أنه كثرا 
ما يتم الإبلاغ عن حدوث انتهاكات. فمثلد كانت شركة گهء1مه۸ (وكما أشرنا آنقّاء أنها متحدة 
الآن مع 8غ101643) تجمع معلومات غير مُصَرَّح بها مشتخدم من مستخدمي 126600016 


V1‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


وتم حظرها لاحقًا من ع82665001. وقد ذكر عامود في Joel Stein (2011) e.Jà; Time álz‏ 
أنه بعد مرور ساعة من إعطاء عنوان بريده الإلكتروني إلى شركة متخصصة في مراقبة معلومات 
المستخدمين ((reputation.com)‏ تمكنوا بالفعل من اكتشاف رقم الضمان الاجتماعي الخاص 
به ويّعد هذا الرقم مفتاحًا للوصول إلى معلومات خاصة عن الممُستخدم وقد يؤدي إلى سرقة 
الهوية. ولذا؛ فإنه ينشأ عن انتهاكات الخصوصية مخاوف من السلوك الإجرامي الذي يستند إلى 
معلومات المُستخدم» وهذا المجال يُعد مصدر قلق كبير ويحتاج إلى دراسة متأنية. وسيقوم موقع 
الويب الخاص بهذا الكتاب بتحديث التطورات الجديدة. ويُعد موقع مجلة «What They‏ 
Wall Street‏ «Kn0wمصدرًا‏ ينبغي الرجوع إليه بشكل دوري. وهذه الأمثلة لا توضح فقط قوة 
التحليلات في التمكن من معرفة ا مزيد حول العملاء المستهدفينء بل إنها أيضًا تعمل بمثابة تحذير 
d god‏ التحليلات بشأن كونها حساسة تجاه الخصوصية والقضايا الأخلاقية. 

وهناك مجال تطبيق آخر يجمع بين تأثير تقنية المعلومات التنظيمية» والبيانات الضخمة 
وأجهزة الاستشعارء والاهتمامات المتعلقة بالخصوصية يقوم بتحليل سلوكيات الموظف معتمدًا 
على البيانات التي يتم جمعها من أجهزة الاستشعار التي يرتديها الموظفون في الشارة. وهناك 
شركة واحدةء وهي 11111131126 ذكرت أن العديد من هذه التطبيقات هي جزء لا يتجزأ من 
أجهزة الاستشعار التي يرتديها الموظفون. وتقوم هذه المستشعرات بتعقب كل تحركات الموظف. 
وبطبيعة الحالء فإنه ينشأ عن ذلك قضايا خصوصية كبيرة. فهل يجب أن تكون الشركات قادرة 
على رصد تحركات موظفيها بهذا Humanyze c»3làl ög SJal‏ أن تحليلاتها تقدم تقريرًا على 
أساس إجمالي عملائها فقط؛ فلا تتم مشاركة بيانات المُستخدم الفردية. وقد لاحظوا أن بعض 
أصحاب العمل يرغبون في الحصول على بيانات فردية للموظفينء بيد أن عَفُدهم هنع هذا النوع 
من المشاركة بشكل واضح. وعلى أي حال» فإن أجهزة الاستشعار تؤدي إلى مستوى آخر من المراقبة 
والتحليلات» الأمر الذي يفرض أسئلة مثيرة للاهتمام تتعلق بالخصوصية. والقوانين» والأخلاق. 


من يمتلك بياناتنا الخاصة؟ 


مع النمو الأخير للبيانات حسب استخدامنا للتقنية وقدرة الشركات على الوصول إليها 
واستخراجهاء فإن النقاش المتعلق بالخصوصية يؤدي أيضًا إلى السؤال الواضح حول لمن تكون ملكية 
بيانات المستخدم. وقد سلط داءاء11 )٠١15(‏ الضوء على هذه القضية في عمود 81002518 
.Businessweek‏ وإليك مثالا على سيارة جديدة نسبيًاء حيث تم تجهيز السيارة بالعديد من 
أجهزة الاستشعار بدءًا بأجهزة استشعار ضغط الإطارات وصولًا إلى أجهزة تتبّع الموقع 625 والتي 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vv‏ 


الفصل الثامن 


يمكنها تتبع المكان الذي تذهب إليهء ومدى السرعة التي تقود بهاء ومتى قمت بتغيير الطرق» وغير 
ذلك. وقد تعرف السيارة حتى وزن الراكب الذي انضم إلى ا مقعد الأمامي. وكما يشير ۷٤11‏ فإن 
السيارة المتصلة بالإنترنت (وهذا حال معظم السيارات الجديدة) قد تكون كابوسًا خاضًا لمالكها أو 
”منجم ذهب“ بيانات لمن يستطيع امتلاك هذه البيانات. وهناك معركة كبيرة محتدمة بين شركات 
صناعة السيارات ومقدمي التقنية مثل: عأمجف (تزداط تدن)؛ (Android Auto) Googles‏ 
على من يمتلك هذه البيانات ومن الذي يمكنه الوصول إليها. وهذا الأمر أصبح أكثر أهمية لأن 
السيارات أصبحت ذاتية القيادة بشكل أكبرء ومن الممكن أن يكون السائق / الراكب في السيارة 
عميلًا مستقبليًا مستهدفًا بشكل كبير لمنتجات وخدمات محددة ومعروفة بشكل جيد للمنظمة 
القادرة على إنشاء ذلك ا ملف الشخصي. فعلى سبيل المثال» يجمع تطبيق Google's Waze‏ 
بيانات نظام تحديد الموقع للمُستخدم لما يزيد عن 00 مليون مُستَخدم لتتبع معلومات الحركة 
المرورية ومساعدة المستخدمين في العثور على أفضل مسارء ولكن عندئذ تُعرض الإعلانات المنبثقة 
على شاشات المستخدمين. ومن الجدير بالذكر أن تطبيقات ماعلا و1غهم5 والتطبيقات الأخرى 
شائعة الاستخدام في السيارة لها نفس الخطط والتطبيقات. 

وهناك معركة أخرى مشابهة محتدمة حول صحة المستخدمين وبيانات القياس الحيوي. وبسبب 
ا مخاوف الأمنيةء فإن العديد من المستخدمين يتحولون إلى تسجيل الدخول الحيوي للتحقق من 
الشخصية باستخدام بصمات الأصابع؛ وشاشات اللمسء وغير ذلك. ونظرًا لأن هذه المعلومات ينفرد 
بها الفرد دون غيره بشكل كبيرء فقد يصبح التنميط المستقبلي للمستخدم أكثر دقة. وبالتالي» فإن 
معركة امتلاك هذه المعلومات وربطها ببيانات أخرى تم جمعها تتزايد هي الأخرى. وبالمثل فإن 
ا مستشفيات والأخصائيين الطبيين والمختبرات وشركات التأمين تجمع الكثير من المعلومات حول 
تاريخنا الطبي. وعلى الرغم من وجود قوانين صارمة في الولايات المتحدة (مثل: (HIPAA‏ لحماية 
خصوصية المستخدم: إلا أن تجميع مثل هذه المعلومات يطلق العنان للتقدم الكبير في التحليلات 
الصحية. ومع ذلكء فإن التحدي المتعلق بالخصوصية: لايزال حقيقيًا للغاية. 

ولي تكون خبيرًا في تحليل البيانات: فإن الحد الأدنى لذلكء أن تكون مدركًا تمامًا للقضايا القانونية 
والأخلاقية التي ينطوي عليها جمع المعلومات التي قد تكون خاصة أو محمية. وهناك سؤال عام 
لتطرحه على نفسك وهو: هل ترغب في تضمين معلوماتك الخاصة في التطبيق الذي تفكر فيه؟ 
الأخلاق في اتخاذ ودعم القرار: 

وينقلنا السؤال الأخير إلى العديد من القضايا الأخلاقية المرتبطة بالتحليلات. وتتضمن القضايا 
الأخلاقية التي قد تمثل أهمية في تنفيذ التحليلات ما يلي: 


VA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


- المراقبة الإلكترونية. 
- الأخلاق في تصميم أنظمة .Cagles .Courtney .Paradices «Chae j5l) jlj3Jl ess‏ 2005(- 
- سرقة البرمجيات. 
- انتهاك خصوصية الأفراد. 
- استخدام قواعد بيانات الملكية. 
- استخدام الملكية الفكرية مثل المعرفة والخبرة. 
- تعرض ابلوظفين لبيئات غير آمنة مرتبطة بأجهزة الحاسب. 
- إمكانية وصول العاملين غير المصرح لهم إلى جهاز الحاسب. 
- دقة البيانات» والمعلومات» وا معرفة. 
- حماية حقوق المستخدمين. 
- سهولة الوصول إلى المعلومات. 
- استخدام أجهزة حاسب الشركة لأغراض ليس لها علاقة بالعمل. 
- مقدار تفويض أجهزة الحاسب في اتخاذ القرار. 

تشكل القيم الشخصية عاملًا مهما في قضية اتخاذ القرارات الأخلاقية. وتعتبر دراسة القضايا 
الأخلاقية معقدة نظرًا لأنها متعددة الأبعاد. لذلك؛ فمن المنطقي أن تتطور الأطر لوصف 
العمليات الأخلاقية والنظم. وقد بيّن كل من 2/1850 01282 (1995) كيف توسع التقنية 
والابتكار من حجم مجال الأخلاقيات وكيف تناقش نموذجًا للتفكير الأخلاقي ينطوي على أربعة 
أسئلة أساسية للتركيزء وهي: 
-١‏ من هو الوكيل؟ 
۲- ما هو الإجراء الذي اتخذ بالفعل أو يجري التفكير فيه؟ 
۳- ما هي نتائج أو عواقب الفعل؟ 
ع- هل النتيجة عادلة أم أنها فقط لجميع أصحاب المصلحة؟ 

كما وصفوا التسلسل الهرمي للتفكير الأخلاقي الذي يستند فيه كل حكم أو عمل أخلاقي إلى 
قواعد وقوانين الأخلاق» والتي تقوم على المبادئ التي تستند بدورها على نظرية أخلاقية. 

هناك قصة واحدة هي التي جعلت العديد من المستخدمين مستائين (على الرغم من أنها 
مم تكن غير قانونية)»ء فقد كانت تجربة ال 153660001 هي إحدى تجارب الماضي وكانت هذه 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vya‏ 


الفصل الثامن 


التجربة لتقديم الأخبار المختلفة للمستخدمين ومراقبة ردود أفعالهم العاطفية والتي كانت تقاس 
من خلال الردود» والإعجابات» وتحليل المشاعرء وغير ذلك (وعلى سبيل الممثالء انظر Goel‏ 2014(« 
وتعمل معظم الشركات» ما في ذلك شركات التقنية على تشغيل اختبار المستخدم لتحديد ا ميزات 
التي تحظى بميول الكثيرين إليها أو التي تكون غير مُحبّبة ومن ثم تقوم الشركات بتعديل عروض 
uS Facebook JI oÑ hsg Lalai‏ للغاية» فإن أمر تشغيل هذه التجربة بدون الموافقة 
المسبقة للمستخدمين يُعد أمرًا غير أخلاقي. وفي الواقع» فقد اعترف 1265001 بخطئه ومن لم 
iua 2251 cael‏ اللراجعة الرسهية من خلال :لوخات اللراععة الذاعلية وآليات الامتغال الأحزق 
للاختبار في المستقبل. وعلى الرغم من أنهم واجهوا الكثير من الصحف السيئة في البداية» إلا أن 
ردهم في الوقت المناسب سمح لهم باستعادة مكانتهم سريعا. 
أسئلة مراجعة على القسم 0-8: 
-١‏ اذكر بعض القضايا القانونية الخاصة بالتحليلات. 
'- قم بوصف المخاوف المتعلقة بالخصوصية في التحليلات. 
- من وجهة نظركء من الذي ينبغي أن يمتلك البيانات المتعلقة باستخدامك للسيارة؟ 
-٤‏ اذكر القضايا الأخلاقية في التحليلات. 
۸ آثار التحليلات فى المنظمات: نظرة عامة: 
تعد الأنظمة التحليلية عوامل مهمة في ثورة ا معلومات واب معرفة وهذا تحول ثقافي يلتقي فيه 
معظم الناس الآن فقط للتوصل إلى بنود. وعلى العكس من الثورات البطيئة التي كانت تحدث 
في الماضيء مثل الثورة الصناعيةء فإن هذه الثورة تحدث بسرعة كبيرة وتؤثر على كل جانب من 
جوانب حياتنا. ويلازم هذا التحول السريع مجموعة من القضايا الإدارية والاقتصادية والاجتماعية. 
إن فصل أثر التحليلات عن تلك التأثيرات الخاصة بالأنظمة الأخرى ا محوسبة لهي مهمة صعبة 
لا سيما بسبب الاتجاه نحو الدمج» أو حتى التضمين» والتحليلات مع أنظمة المعلومات الأخرى التي 
تعتمد على الحاسب. ويمكن للتحليلات أن يكون لها آثار دقيقة وآثار جسيمة على حد سواء. فهذه 
الأنظمة يمكنها أن تؤثر على الأفراد والوظائف. بالإضافة إلى أنها يمكنها التأثير أيضًا على هياكل عمل 
الإدارات والوحدات داخل المنظمة. كما يمكن أن يكون لها أيضًا تأثيرات كبيرة على المدى الطويل 
على الهياكل التنظيمية الإجماليةء والصناعات بأكملهاء وا مجموعات» وا مجتمع ككل (أي: أثر كلي). 


Ve.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


وسوف يكون للنمو المفاجئ في التحليلات» والذكاء الاصطناعيء والحوس بة المعرفية أثر كبير 
على مستقبل المنظمات. ويمكن تقسيم أثر أجهزة الحاسب والتحليلات إلى ثلاث فئات عامة: 
تنظيمية» وفرديةء ومجتمعية. وقد كان لأجهزة الحاسب العديد من التأثيرات في كل فئة من هذه 
الفئات. ولا يمكننا النظر في جميع هذه الأمور في هذا القسم. لذا؛ فإننا سوف نتطرق في الفقرات 
التالية إلى الموضوعات التي نرى أنها أكثر صلة بالتحليلات. ويوضح الشكل (۷-۸) الموضوعات 
العامة التي نخطط لتغطيتها. 





شكل ۷-۸: أثر التحليلات على المنظمات 


وحدات تنظيمية جديدة: 


ويتمثل أحد التغييرات في الهيكل التنظيمي في إمكانية إنشاء قسم للتحليلات» أو قسم ذكاء 
الأعمالء أو قسم علم البيانات الذي تلعب فيه التحليلات دورًا رئيس ا. وهذه الوحدة الخاصة 
يمكن دمجها مع وحدة التحليل الكمي أو استبدالهاء أو يمكن أن تكون كيانًا جديدًا تمامًا. وبعض 
الشركات الكبيرة لديها وحدات أو إدارات منفصلة لدعم القرار. فعلى سبيل المثال» فإن العديد 
من البنوك الكبرى لديها مثل هذه الإدارات في أقسام الخدمات المالية الخاصة بها. كما أن العديد 
من الشركات لديها وحدات صغيرة من علم البيانات أو ذكاء الأعمال / مستودع البيانات. وعادةً ما 
تشارك هذه الأنواع من الإدارات في التدريب بالإضافة إلى أنشطة تطوير الاستشارات والتطبيقات. 
وهناك شركات أخرى فوّضت أحد كبار مسؤولي التقنية ليكون مس ؤولًا عن ذكاء الأعمالء وعن 
الأنظمة الذكية: بالإضافة إلى تطبي قات التجارة الإلكترونية. وهناك شركات مثل Target ià‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ve!‏ 








الفصل الثامن 


وشركة 1172150216 لديها استثمارات كبيرة في مثل هذه الوحداتء والتي تعمل باستمرار على تحليل 
بياناتها لتحديد كفاءة التسويق وإدارة التوريد من خلال فهم تفاعلات كل من العملاء والموردين. 
وعلى الجائب الآخرء فإن هناك شركات عديدة تقوم بدمج تخصصات als‏ التحليلات / البيانات 
داخل المجالات الوظيفية مثل التسويقء والتمويل» والعمليات. وبشكل عام. فإن هذا المجال 
هو أحد المجالات التي يوجد بها فرص عمل كبيرة حاليًا. وقد حددنا في الفصل الأول عناوين 
الوظائف التي لها صلة بهذا الموضوع, كما سنقدم وصفقًا عام لعالم البيانات المثالي في القسم التالي. 
وقد أدى نمو صناعة ذكاء الأعمال إلى تكوين وحدات جديدة داخل الشركات التي تقدم خدمات 
تقنية ا معلومات أيصًا. فعلى سبيل ال مثال» قامت 1814 قبل بضع سنواتء بتشكيل وحدة أعمال 
جديدة تركز على التحليلات. وقد تضمنت هذه المجموعة وحدات في ذكاء الأعمالء وتماذج 
الأمثلية» والتنقيب ف البيانات» وأداء الأعمال. والأهم من ذلك» هو أن ا مجموعة لا تركز فقط 
على البرمجيات» بل إنها تركز بشكل أكبر على الخدمات / الاستشارات. وكما هو مُلاحظ في الأقسام 
السابقة» فإن النمو الهائل في صناعة التطبيقات قد أنشأ العديد من الفرص للشركات الجديدة التي 
يمكنها توظيف التحليلات وتقديم تطبيقات مبتكرة في أي مجال محدد. كما لاحظنا فيما سبق 
كيف تقوم الشركات الصناعية التقليدية في العصر الصناعي ÀS s General Electric 4$ Jis‏ 
5 بإعادة تأهيل نفسها لتوليد عائدات كبيرة من تقديم خدمات التحليلات التي لها صلة 
بمنتجاتها وخدماتها. وهذا من شأنه أن يغير هيكل السلطة التنظيمية؛ نظرًا لأن هيكل القوة 
التنظيمية عادةً ما يُشتق من المكان الذي يتم فيه إنشاء معظم الدخل. 


إعادة تصميم المُنظمة من خلال استخدام التحليلات: 


يقوم مجال بحثي وعملي حديث الظهور بتوظيف تقنيات علم البيانات لدراسة الديناميكيات 
التنظيميةء وسلوك الأفرادء وإعادة تصميم المنظمة لتحقيق أهدافها بشكل أفضل. وتُعرف 
تطبيقات هذه التحليلات في الواقع باسم «تحليلات الأشخاص». فعلى سبيل ال مثالء تُستَخدّم 
التحليلات من قبل إدارة الموارد البشرية لتحديد المُرشحين المثاليين من التجمع الذي يُقدم سير 
ذاتية للمنظمة: أو حتى من خلال تجمّع أوسع مثل 11516415. وقد تم تطوير التطبيقات 
لتحديد أفضل ال مرشحين الذين لا يحتمل مغادرتهم للمنظمة. فالإبقاء على الموظف يشبه الإبقاء 
على العميل» ولذلك» فإن تقليل ”الحركة“ داخليًا لهو أمر مهم بنفس القدر لنجاح المنظمة. 

ويتعلق مجال التطبيق الحديث والأكثر إثارة بفهم سلوك الموظفين من خلال مراقبة تحركاتهم 
داخل المنظمة واستخدام تلك امعلومات لإعادة تصميم التخطيط أو لإعادة تشكيل الفرق لتحقيق 


ver‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


أداء أفضل. وهناك شركة Humanyze yaus‏ (کانت معروفة سابقًا Sociometric Solutions gwl‏ 
وذْكرّت في القسم 2-8) لديها شارات تتضمن نظام تحديد المواقع G۴5‏ وجهاز استشعار. وعند 
ارتداء الموظفين لهذه الشارات» يتم تسجيل جميع تحركاتهم. وحسبما وَرّدء فقد تمكنت شركة 
Humanyze‏ من مساعدة الشركات في التنبؤ بأي نوع من الموظفين من المرّجِح بقاؤه بالشركة أو 
مغادرتها على أساس تفاعلات هؤلاء الموظفين مع غيرهم من الموظفين الآخرين. فعلى سبيل ال مثالء 
الموظفون الذين يبقون في مقصوراتهم الخاصة تكون فرصة ترقيهم في سلم الشركات أقل بكثير 
من الموظفين الذين يتنقلون ويتفاعلون مع غيرهم من الموظفين الآخرين على نطاق واسع. وقد 
ساعد جمع وتحليل البيانات المتشابهة شركات أخرى على تحديد حجم قاعات المؤتمرات المطلوبة 
أو حتى تصميم المكتب لتحقيق أقصى قدر ممكن من الكفاءة. ووفقًا Humanyze g59¢ 339 U‏ 
على الإنترنت» فقد أرادت إحدى الشركات فهم خصائص قادتها بشكل أفضل. ومن خلال تحليل 
البيانات من تلك الشارات» تمكنت الشركة من إدراك أن القادة الناجحين لديهم بالفعل شبكات 
أكبر يتفاعلون معهاء كما أنهم يقضون وقثًا أطول في التفاعل مع الآخرين. فضلًا عن أنهم يتمتعون 
بالنشاط البدني. وقد استخدمّت المعلومات التي جُمعَت من جانب قادة الفرّق لإعادة تصميم 
مساحة العمل والمساعدة في تحسين أداء القادة الآخرين. ومن الواضح أن هذا يؤدي إلى قضايا 
تتعلق بالخصوصية» غير أن مثل هذه الدراسات قد تكون قابلة للتطبيق داخل المنظمة. ويحتوي 
موقع 1111131726 على العديد من دراسات الحالة المثيرة للاهتمام والتي تقدم أمثلة على كيفية 
استخدام تقنيات البيانات الضخمة لتطوير هياكل فريق أكثر كفاءة وتصميم تنظيمي. 


أثر التحليلات على أنشطة المديرينء وأدائهم» ورضاهم الوظيفي: 


على الرغم من أن العديد من الوظائف قد تتمتع بثراء كبير في جانب التحليلات» إلا أن هناك 
وظائف أخرى قد تصبح أكثر رتابة وأقل إرضاء. فعلى سبيل المثاله قبل أكثر من ٠غ‏ عامّاء Us‏ 
ئ (1971) بأن أنظمة المعلومات التي تعتمد على الحاسب من شأنها أن تقلل من السلطة 
التقديرية الإدارية في عملية اتخاذ القرار وهذا يؤدي إلى عدم رضا المديرين. ومع ذلك: فقد وجد كل 
Harris g Davenport ¿e‏ )2005( $ دراستھم لنظم القرار الآلي أن الموظفين الذين يستخدمون 
هذه الأنظمة. وخصوصًا من يتم تمكينهم بواسطة الأنظمة: كانوا أكثر رضًا عن وظائفهم. وإذا 
أمكن أداء العمل الروتيني والعمل البسيط باستخدام نظام تحليليء فإنه يجب تهيئة المديرين 
والعاملين في مجال المعرفة لمواجهة الزيد من التحديات. ويعد أهم عمل يقوم به المديرون هو 
اتخاذ القرارات. وتستطيع التحليلات أن تغير الطريقة التي يتم بها اتخاذ العديد من القرارات» 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ver‏ 


الفصل الثامن 


وبالتالي فإنه يمكن تغيير مسؤوليات الوظائف الخاصة بالمديرين. وعلى سبيل المثال: فقد وجد 
Plaisentg «Perez-Cascante ja ds‏ ودع دمتتاع 812 بالإضافة إلى 862314 (2002) أن نظام 
دعم القرار قد استطاع تحسين أداء كل من المديرين الحاليين والمديرين الجدد فضلًا عن الموظفين 
الآخرين. فقد ساعد المديرين على اكتساب المزيد من المعارفء والتجارب» والخبرة وبالتالي تعزيز 
جودة صنع القرار. وقد أعلن العديد من المديرين أن أجهزة الحاسب قد منحتهم أخيرا الوقت 
للخروج من المكتب والتواجد في الساحة. كما وجدوا أيضًا أن بإمكانهم قضاء المزيد من الوقت في 
التخطيط للأنشطة بدلا من إضاعة الوقت في حل المشاكل حيث إنه من الممكن تنبيههم للمشاكل 
المحتملة في وقت مبكر وذلك بفضل العوامل الذكية وغيرها من الأدوات التحليلية. 


ويكمن الجانب الآخر من التحدي الإداري في قدرة التحليلات على دعم عملية صنع القرار 
بشكل عام» بالإضافة إلى قدرتها على التخطيط الإستراتيجي والتحكم في القرارات بشكل خاص. 
حيث يمكن للتحليلات أن تغير عملية صنع القرارء بل يمكنها تغيير أنماط اتخاذ القرار. فعلى 
سبيل المثال» يتم الانتهاء من جمع المعلومات من أجل صنع القرار بسرعة أكبر في حالة استخدام 
التحليلات. وتُعد نُظم معلومات المؤسسة مفيدة للغاية في دعم الإدارة الإستراتيجية. وتُستخدم 
الآن تقنيات التنقيب في البيانات والنص والويب لتحسين المسح البيئي الخارجي للمعلومات. 
ونتيجة لذلك؛ يستطيع المديرون تغيير نهجهم لحل المشاكل وتحسين قراراتهم بسرعة. ويقال إن 
ستاربكس قامت مؤخرًا بتقديم مشروب قهوة جديد. واتخذت قرارها بشأن التسعير من خلال 
تجربة عدة أسعار مختلفة ورصد ردود الفعل على وسائل التواصل الاجتماعي على مدار اليوم؛ 
وهذا يعني أن أساليب جمع البيانات لأحد المديرين قد تختلف الآن بشكل كبير عما كانت عليه 
في الماضي. وتشير الأبحاث إلى أن معظم المديرين يميلون إلى العمل على عدد كبير من المشاكل 
في وقت واحد. متنقلين من مشكلة إلى أخرى كأنما ينتظرون المزيد من المعلومات عن مشكلتهم 
الحالية (انظر .Lampels «Mintzberg‏ وصصنتنا0» واGhosha»‏ 2002). وتقوم تقنيات التحليلات 
بتقليل الوقت المطلوب لإتمام المهام في عملية اتخاذ القرار كما أنها تقضي على بعض فترات الانتظار 
التي تعطل الإنتاج وذلك من خلال توفير المعرفة والمعلومات. وبالتالي» يعمل المديرون على عدد 
أقل من اللهام خلال كل يوم غير أنهم يكملون المزيد منها. وقد يكون تقليل وقت البدء المرتبط 
بالانتقال من مهمة إلى أخرى هو أهم مصدر لزيادة الإنتاجية الإدارية. 

وقد يكون من بين الآثار ا محتملة الأخرى للتحليلات على وظيفة المدير هو التغيير في متطلبات 
القيادة. والتي تعتبر الآن من الصفات القيادية الجيدة بشكل عام والتي قد تكون تغيرت بشكل 
كبير من خلال استخدام التحليلات. فمثلاء يُستبدل التواصل وجهًا لوجه بشكل متكرر بالبريد 


vee‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


الإلكتروني» ومواقع الوييء والمؤتمرات المحوسبة؛ وبالتاليه فإن الصفات القيادية التي ترجع إلى 
المظهر الخارجي من الممكن أن تصبح أقل أهمية. 
وفيما يلي بعض الآثار المحتملة للتحليلات على وظائف المديرين: 
- تتطلب عملية اتخاذ العديد من القرارات خبرة (تجربة) أقل. 
- يمكن اتخاذ القرار بشكل أسرع بسبب توافر ا معلومات وجعل بعض مراحل اتخاذ القرار آلية. 
- يتطلب توفير الدعم لكبار المسؤولين التنفيذيين اعتمادًا أقل على الخبراء والمحللين؛ ويستطيع 
المديرون فعل ذلك بأنفسهم بمساعدة الأنظمة الذكية. 
- تتم إعادة توزيع الطاقة بين المديرين. (كلما زادت قدرة امعلومات والتحليل التي يمتلكونها. 
زادت القوة لديهم). 
- دعم القرارات المعقدة يجعلها أسرع في التطورء كما أنها ستكون ذات جودة أفضل. 
- يتم التعجيل با معلومات المطلوبة لاتخاذ القرارات عالية امستوى أو حتى يتم إنشاؤها ذاتيًا. 
- قد تؤدي الآلية في القرارات الروتينية أو في مراحل عملية اتخاذ القرار (مثل؛ اتخاذ القرارات عبر 
الخطوط الأمامية واستخدام 415) إلى إلغاء بعض المديرين. 
cele JS ias‏ تبين أن وظيفة المديرين المتوسطين هي الوظيفة الأكثر عرضةً لأن تكون آلية. 
حيث يقوم مديرو المستوى المتوسط باتخاذ قرارات روتينية إلى حد ماء والتي يمكن جعلها آلية 
بالكامل. وبالنسبة لمديري المستويات الدنيا فإنهم لا يقضون الكثير من الوقت في اتخاذ القرار. 
فهم بدلا من ذلكء يقومون بالإشراف على غير المديرين» ويديرونهم, ويحفزونهم. وقد تكون 
بعض قراراتهم الروتينية آليةء مثل الجدولة؛ أما القرارات الأخرى التي تنطوي على جوانب سلوكية 
فلا يمكن جعلها آلية. وعلى أي حالء فإننا حتى لوقمنا بجعل دورهم الأساسي آليّا بشكل كامل» 
فإننا لن نتمكن من جعل وظائفهم آلية. ويوفر الويب فرصة لجعل مهام معينة لموظفي الخطوط 
الأمامية آلية؛ وبالتالي فإن ذلك يؤدي إلى خفض عبء العمل على المديرين المخولين بالموافقة. أما 
وظيفة كبار المديرين فهي أقل روتينية» وبالتالي يصعب جعلها عملية آلية. 
إعادة الهيكلة الصناعية: 
بدأ عدد قليل من المؤلفين بالتكهن بأثر الذكاء الاصطناعيء والتحليلات: والحوسبة الإدراكية على 
مستقبل الصناعة. وهناك القليل من المصادر الحديثة الممتازة التي يمكن مراجعتها وهي )2016( 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Veo‏ 


الفصل الثامن 


(The Ec010”is†( خاص من قبل ذي إيكونوميست‎ 2 35s Ransbothams (2016) Autor 
تقرير ذي‎ 455532016) McAfees Brynjolfsson s JS 4:5 (0555 (Standage, 2016) 
إيكونوميست 860201156 16 تقريرًا شاملا إلى حد كبيرء كما أنه ينظر في العديد من الأبعاد لتأثير‎ 
التطورات الحالية على الصناعة والمجتمع. وتتمثل الأسباب الرئيسة في أن التقنية تمَكّن أجهزة الحاسب‎ 
الآن من القيام بالمزيد والمزيد من المهام التي قام بها البشر. وهذا بالطبع. حدث من قبلء في الثورة‎ 
الصناعية. وما يجعل التغيير هذه المرة أكثر أهمية بكثير هو أن التقنية تمُكّن الآلات من القيام بالعديد‎ 
من المهام المعرفية. كما أن سرعة التغيير جذرية إلى الحد الذي يدعو إلى التنبؤ بأن الأثر المحتمل على‎ 
المنظمات والمجتمع سيكون مهما للغاية» وفي بعض الأحيان لا يمكن التنبؤ به. وبالطبعء فإن هؤلاء‎ 
المؤلفين لا يتفقون في تنبؤاتهم. وفي هذه الفقرة دعونا نركز على الآثار التنظيمية أولًا. حيث يناقش‎ 
أن الحوسبة الإدراكية ستحول العديد من الوظائف التي يقوم بها البشر ليتم‎ 2016) Ransbotham 
القيام بها بواسطة أجهزة الحاسب» مما يترتب عليه تقليل تكاليف المنظمات. كما أن جودة المخرجات‎ 
قد تزيد أيضًا في العمل ا معرف» والتي ظهرت في العديد من الدراسات التي تقارن أداء الإنسان بأداء‎ 
نظام 600816 الفائز في لعبة‎ 3l Jeopardy à IBM Watson الآلة. فالجميع على علم تام بفوز‎ 
ضد الأبطال البشريين. غير أن العديد من الدراسات الأخرى في مجالات محددة مثل التعرف على‎ GO 
الكلام وتفسير الصور الطبية قد أظهرت تفوقًا مماثلًا للنظام الآلي في حالة ما إذا كانت المهمة عالية‎ 
التخصص ولكنها روتينية أو متكررة. أيضّاء فإنه نظرًا للاتجاه نحو توفير الأجهزة في جميع الأوقات وفي‎ 
جميع المواقع» فإن ذلك قد يزيد من اتساع ال منظمةء مما يؤدي إلى سهولة التدرج وبالتالي منافسة أكبر‎ 
بين المنظمات. وهذه الآثار التنظيمية تعني أن المنظمات التي كانت بارزة بالأمس من الوارد ألا تظل‎ 
في المقدمة إلى الأبد. لأن الحوسبة الإدراكية والآلية يمكنها تحدي اللاعبين الراسخة أقدامهم. وهذا هو‎ 
في صناعة السيارات. وعلى الرغم من محاولة شركات السيارات التقليدية اللحاق بالركب‎ lái Jbl 
بسرعة: إلا أن شركات كل من 600816 و1513 وشركات التقنية الأخرى تعمل على تعطيل هيكل‎ 
الصناعة من خلال تحدي قادة عصر السيارات. وتقوم التحليلات بتمكين العديد من هذه التغييرات.‎ 


أثر الأتمتة على الوظائف: 


كما تناقش التقارير البحثية التي سبق أن حددناها في الفقرة السابقة أيضًا تأثير التقدم في 
علم البيانات والذكاء الاصطناعي على الوظائف البشرية. وكما أوضحنا سابقًاء فإن العديد من 
مهام العاملين في مجال المعرفة يمكن الآن تنفيذها آليّا. وف الوقت ذاته» فإن التقنية لا تؤدي 
JI Ls‏ تقليل عدد الأشخاص الذين يتم توظيفهم. فکما لاحظ ۲٥ا۸‏ (2016)» فقد تضاعف 


vel‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


عدد ماكينات الصرف الآلي (8:12/1) أربعة أضعاف من حوالي ٠٠١٠٠١‏ إلى 0٠.٠٠٠‏ في الفترة بين 
عامي 1990 و١701‏ إلا أن عدد موظفي البنوك قد زاد في نفس الوقت من حوالي نصف مليون 
موظف في عام 198١‏ إلى حوالي 00٠,٠۰١‏ موظف في عام .7٠٠١‏ فما حدث هو أن الجزء الروتيني 
من العمل أصبح يتم عن طريق أجهزة الصرف الآلي (8:12/1): أما موظفو البنك فقد أصبحوا على 
اتصال أفضل بالعملاء كما أصبحوا يركزون الآن على خدمات البيع. وبالطبع» فإن بعض هذه 
الخدمات يمكن أيضًا تقديمها من خلال نماذج التحليلات التي تحدد العملاء المناسبين للحصول على 
فرصة محددة. وقد قدم )2016( Ransbotham‏ مثالا آخر. وعادة ما تعتبر الاستشارات اطالية 
مهمة تعتمد على المعرفة. ونظرًا لأن تقنية علم البيانات توفر دعمًا مخصصًا لسيناريو محدد» فإن 
تكاليف هذه الخدمات سوف تنخفض. وهذا سيؤدي إلى تزايد الأشخاص الذين يختارون المطالبة 
بمثل هذه الخدماتء مما سيؤدي في النهاية إلى الحاجة لوجود المزيد من البشر للعمل المتقدم. 

ويدعي بعض هؤلاء المؤلفين بأن الأتمتة التي ترجع إلى الحوسبة المعرفية والذكاء الاصطناعي 
سوف تسرع ما يسمى ب «الاستقطاب» لسوق العمل في المستقبل. وهذا يتبعه نمو كبير في 
الوظائف في المستويات العليا والدنيا من سوق العملء غير أن الخسائر تكون في الوسط. وتستمر 
الوظائف التي تتطلب مهارات منخفضة كخدمات الحراسة: والرعاية الشخصية: وإعداد الطعام 
وما إلى ذلكء في النمو. وبالمثل فإن الوظائف التي تتطلب مستويات مهارة عالية جدًاء كالتصميم 
الإداريء وتصميم الرسومات» والعمل الحاسوبي تتزايد هي الأخرىء» في حين أن الوظائف التي 
تتطلب معرفة متخصصة ”المهارات المتوسطة“ والتي تم تطبيقها مرارًا وتكرارًا مع بعض التكيف». 
هي الوظائف الأكثر عرضةً للاختفاء. ففي بعض الأحيان تتداخل التقنية في نفسها. فعلى سبيل 
ا لمثالء فإن تحليلات Watson‏ 182/1 تتضمن الآن إمكانات أولية للبدء في طرح الأسئلة التي يمكن 
أن يطلبها أحد متخصصي التحليلات من مخزن البيانات» ومن الواضح» أنها تُقدم إجابات. «Jis‏ 
فإن التحليلات الأخرى - كعروض الخدمات - قد تؤدي إلى تقليل عدد الأشخاص الذين يحتاجون 
إلى الكفاءة عند استخدام برامج التحليلات. 

ويشير تقرير ذي إيكونوميست إلى أنه حتى لو لم يحل الذكاء الاصطناعي محل العمال 
بشكل مباشرء فإن الأمر سوف يتطلب منهم بالتأكيد اكتساب مهارات جديدة ليظلوا قادرين 
على المنافسة. كما أن تعطل السوق دام ما يكون غير مريح. وسوف توفر السنوات القليلة 
المقبلة فرضًا ممتازة لمتخصصي التحليلات لتشكيل المستقبل. وفي القسم التالي سوف نحدد بعض 
السمات العامة لمتخصص علم البيانات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vev‏ 


الفصل الثامن 


الآثار غير المقصودة للتحليلات: 


إلى جانب القضايا التي ناقشناها بالفعل فيما يتعلق بالخصوصية: والأخلاقيات» والأمانء والآثار 
الشخصية / التنظيمية للتحليلات» يجب أن يكون المديرون والمختصون بعلم البيانات على دراية 
بالآثار الاجتماعية طويلة الأجل للنماذج. وقد قدم كتاب صدر مؤخرًا Cathy 0©°Neil J‏ )2016( 
هذه الحجج بشكل جيد للغاية مما لاقى انتشارًا في الأخبار. وقد حصلت 0727611 على الدكتوراه 
في الرياضيات من جامعة هارفارد 11315254 وعملت في مجال التمويل وصناعة علم البيانات. وقد 
دفعتها تجاربها وملاحظاتها إلى كتابة كتاب مشهور بعنوان أسلحة تدمير Weapons of lèl JI‏ 
A&S :Math Destruction‏ تزيد البيانات الضخمة من عدم المساواة وتهدد الديموقراطية. ونحن 
ندعوك لقراءة الكتاب» أو على الأقل الاطلاع على موقع مدونتها عبر /ع1ه.ء طادططلتهحم//:دصاغط. 
ls‏ جانب الترويج لكتابهاء فإن موقع المدونة يسلط الضوء على القضايا الاجتماعية التي تتعلق 
بالتحليلات. كما يمكنك الاطلاع على ملخص / استعراض جيد للكتاب عبر هذا الموقع: //:صاغط 
-knowledge.wharton.upenn.edu/article/rogue-algorithms-dark-side-Big-data/‏ 

وتعتقد 0727611 في كتابهاء بأن النماذج يجب أن تستوفي ثلاثة شروط. فالعديد من النماذج 
الرياضية ليست شفافة. فإذا كان النموذج غير مفهوم» فإن تطبيقه يمكن أن يؤدي إلى عواقب 
غير مقصودة. ثانيّه يجب أن يتسم النموذج بأهداف واضحة قابلة للقياس الكميء مثل التطبيق 
المشهور للتحليلات في كتاب وفيلم كرة المال 211:إ21026: وقد كان الهدف من هذا النموذج 
هو زيادة عدد مرات الفوز. وقد كانت مقاييس المدخلات المقترحة من العمر يمكن فهمها 
كذلك. بدلا من استخدام قاعدة التشغيل ال معلنة والأكثر شيوعًا في قياس (۸81)» والتي اقترحها 
الملل واستخدمت في النسب الأساسية والتدابير الأخرى (التي تم حسابها بسهولة وفهمها بسهولة 
من قبل أي شخص لديه مهارات الرياضيات الأساسية). ومن ناحية أخرى. فإن النماذج التي 
بيت لتقييم مخاطر الأوراق المالية المدعومة بالرهن العقاري حيث Y‏ يفهم أحد تمامًا الافتراضات 
الأساسية سوى المتداولين الماليين؛ حيث كانوا يتداولون الأوراق المالية المضمونة على نطاق glo‏ 
وذلك لأنهم قادوا الأزمة المالية في عام .٠٠٠١8‏ أما الشرط الثالث فهو أن النماذج يجب أن تكون لها 
آلية تصحيح ذاتي وعملية في المكان بحيث يتم تدقيق النماذج بانتظام» كما يجري النظر باستمرار 
في المدخلات والمخرجات الجديدة. وهذه المسألة الثالثة تعد بالغة الأهمية في تطبيق النماذج في 
الأماكن الاجتماعية. ومن ناحية أخرى فإن النماذج تديم الفرضيات الخاطئة الكامنة في مرحلة 
النمذجة الأولية. وتناقش gal O'Neil‏ من ال مواقف في هذه الحالة. فمثلا تُستخدم في الولايات 
المتحدة لتحديد المدرسين ذوي الأداء الضعيف ومكافأة المعلمين الأفضل. وقد استخدمت هذه 


VEA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


النماذج درجات اختبار تلاميذهم. وتروي 02711 العديد من الأمثلة التي استخدمت النماذج 
لتسريح اي معلمين «ضعيفي الأداء» على الرغم من أن هؤلاء المعلمين كانوا محبوبين من قبل الطلاب 
وأولياء الأمور. وتستشهد 07761 أيمًا بمثال آخر تتزايد أهميته في العديد من المنظمات» وهو 
أداء العمال؛ حيث يتم استخدام النماذج لتحسين جدولة العمال في العديد من المنظمات. وفي 
العديد من الحالات» يتم تطوير هذه الجداول لتتوافق مع تغيرات الطلب ا موسمية واليومية, 
إلا أن 021611 تأسف لحقيقة أن هذه النماذج لا تأخذ في الاعتبار الآثار الضارة لهذا التفاوت 
في الجداول على أسر هؤلاء العمال ذوي الدخل المنخفض. وهناك أمثلة أخرى من هذا القبيل 
تشمل نماذج تقييم درجة الائتمان والتي تستند على ملامح تاريخية وبالتالي فإنها قد تؤثر EL.‏ 
على الأقليات. وبدون وجود آليات لتدقيق هذه النماذج وآثارها غير المقصودة: فإننا قد نضر أكثر 
مما ننفع على المدى الطويل. ولذلك؛ فإن متخصص علم البيانات يحتاج إلى إدراك هذه المخاوف. 
أسئلة مراجعة على القسم 5-8: 
-١‏ اذكر آثار التحليلات على اتخاذ القرار. 
؟- اذكر آثار التحليلات على المهام الإدارية الأخرى. 
*- قم بوصف الوحدات التنظيمية الجديدة التي أنشئت بسبب التحليلات. 
ع- حدد أمثلة أخرى لتطبيقات التحليلات لإعادة تصميم مساحة العمل أو سلوك الفريق. 
0- كيف تؤثر الحوسبة الإدراكية على هيكل الصناعة؟ 
6- ما هي الوظائف التي من المرجح أن تتغير نتيجة التحول للآلية؟ 
/- ادرس تقرير ذي إيكونوميست (2016 ,5]304386) المذكور في هذا القسم. ما هي الآثار 

الأخرى للآلية؟ وهل وجدتها مثيرة للاهتمام؟ 
۸ عالم البيانات كمهنة: 

عام البيانات هو دور أو وظيفة مرتبطة في كثير من الأحيان بالبيانات الضخمة. وقد أصبح 
هذا الدور من أكثر الأدوار المطلوبة في السوق. وفي مقال نُشر في عدد أكتوبر ١17‏ من مجلة 
gle D. J. Patil Ihomas H. Davenport 5L LUJI 3 LP] Harvard Business Review‏ 
وظيفة عام البيانات بأنها ”الوظيفة الأكثر جاذبية في القرن ١لا".‏ وقد حددوا في تلك المقالة علماء 
البيانات الأساسيين» والأكثر مهارة عامميةء إضافة إلى من لديهم القدرة على كتابة التعليمات البرمجية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vea‏ 


الفصل الثامن 


(بأحدث لغات ومنصات البيانات الضخمة). وعلى الرغم من أن هذه المهارات المذكورة قد تصبح 
في المستقبل القريب أقل دقة خاصة عندما يحمل العديد من الأشخاص لقب «عام البيانات» على 
بطاقات العمل الخاصة بهم» غير أنها تبدو في وقتنا الراهن بأنها أكثر المهارات الأساسية المطلوبة 
من علماء البيانات. وستكون أكثر المهارات استمرارية هي حاجة علماء البيانات إلى التواصل بلغة 
يفهمها جميع أصحاب المصلحة: بالإضافة إلى حاجتهم لإظهار المهارات الخاصة التي تتضمن سرد 
القصص مع البيانات» سواء أكان ذلك شفهيًا و / Davenport, Patil, 2012) 5 ja» 9i‏ 

يستخدم علماء البيانات مزيجًا من مهاراتهم الخاصة بالأعمال بالإضافة إلى مهاراتهم الفنية 
لدراسة البيانات الضخمة؛ بحنّا عن طرق لتحسين ممارسات تحليلات الأعمال الحالية (من وصفي إلى 
تنبّؤي وتوجيهي) ومن ثم تحسين القرارات من أجل فرص الأعمال الجديدة. ومن أكبر الاختلافات 
بين عام البيانات ومُستخدم ذكاء الأعمال مثل محلل الأعمالء هو أن عام البيانات يدرس ويبحث عن 
قدرات جديدةء في حين أن مُستخدم ذكاء الأعمال يقوم بتحليل حالات الأعمال والعمليات الحالية. 

كما يُعد الفضول الشديد هو أحد الصفات الغالبة وا متوقعة من علماء البيانات» معنى وجود 
رغبة عند علماء البيانات للتعمق في المشكلة وعدم تناولها بسطحية: بالإضافة إلى العثور على 
الأسئلة في صميمهاء واستخلاصها إلى مجموعة شديدة الوضوح من الفرضيات التي يمكن اختبارها. 
وهذا يستلزم في كثير من الأحيان التفكير الجماعي الذي هيز العلماء الأكثر إبداعًا في أي مجال. 
فعلى سبيل ال مثال» نحن نعرف عام بيانات يدرس مشكلة الاحتيال والذي أدرك أنها تتشابه مع 
نوع من المشاكل الخاصة بتسلسل الحمض النوويء )2012 OSS 285 (Davenport, Patil,‏ 
هذا العم هو وفريقه من صياغة حل يقلل من خسائر الاحتيال بشكل كبيرء وذلك من خلال 
الجمع بين تلك العوامم ا متفاوتة. 
من أين يأتي علماء البيانات؟ 

على الرغم من وجود بعض الخلاف حول استخدام العلم في الاسم» غير أن هذا الأمر أصبح أقل 
إثارة للجدل. ويستخدم علماء حقيقيون أدوات صنعها علماء آخرونء كوسيلة لتوسيع ال معرفة, أو 
يقومون بصنعها إذا للم تكن موجودة. وهذا هو بالضبط ما يُتوقع القيام به من قبل علماء البيانات. 
فعلى سبيل المثال» ينبغي على علماء الفيزياء التجريبية تصميم ال معدات» وجمع البيانات» وإجراء 
تجارب متعددة لاكتشاف المعرفة وتوصيل نتائجها. وعلى الرغم من أن علماء البيانات قد لا يرتدون 
معاطف بيضاء فضلًا عن أنهم قد لا يعيشون في بيئة معملية معقمة. إلا أن ما يفعلونه بالضبط 


vo.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


يتمثل في: استخدام الأدوات والأساليب الإبداعية لتحويل البيانات إلى معلومات قابلة للتطبيق لكي 
يستخدمها الآخرون لاتخاذ قرارات أفضل. 

الجدير بالذكر أنه لا يوجد إجماع حول الخلفية التعليمية التي ينبغي أن تكون لدى عام 
البيانات. غير أنه عادةً ما يكون المرشح لذلك من أمثال: حاملي معن (أو دكتوراه) في علوم 
الحاسب JII‏ أو نظم المعلومات الإدارية (3115): أو الهندسة الصناعية: أو درجات الدراسات 
التحليلية المشهورة الحديثة. وعلى الرغم من أن كل ذلك قد يكون ضروريًا إلا أنه ليس كافيًا 
لى يطلق على أحد الأشخاص أنه عام بيانات. فمن أهم الخصائص التي ينبغي توافرها في عام 
البيانات هي الخبرة الفنية فضلًا عن الخبرة بمجالات تطبيقات الأعمال. وبهذا المعنى» فإن هذا 
الدور يشبه الأدوار المهنية للمهندس أو الأدوار المهنية لإدارة المشاريع؛» حيث يتم تقييم الخبرة 
بمقدار (إن لم يكن أكثر من) المهارات التقنية والخلفية التعليمية. ولن تكون مفاجأة كبيرة أن 
نرى في غضون السنوات القليلة القادمة شهادة مصممة لعلماء البيانات بشكل خاص (ربما يُطلق 
عليها اسم ”محترف علم البيانات“ أو ”58“ للاختصار). 

ونظرًا لأن هذا الدور هو مهنة لمجال لا يزال قيد التعريفء فإن العديد من ممارسات 
هذه المهنة لاتزال تجريبية كما أنها بعيدة عن أن تكون موحدة. وبالتالي» فإن الشركات تكون 
شديدة الحساسية فيما يتعلق ببّعْد الخبرة لعا البيانات. وبنضج هذه المهنة» والممارسات 
الموحدة: فإن التجربة ستكون أخف من ال مشكلة عند تعريف عام البيانات. وف الوقت 
الحاضرء فإن الشركات تبحث عن الأشخاص ذوي الخبرة الواسعة في العمل مع البيانات المعقدة 
الذين حظوا بالتوظيف الجيد من بين أولئك الذين لديهم خلفيات تعليمية وعملية في العلوم 
الطبيعية أو الاجتماعية. وقد كان بعض أفضل وأ مع علماء البيانات حاصلين على الدكتوراه 
في مجالات مقصورة على فئة معينة مثل علم البيئثة وبيولوجي ا النظم Davenport, Patil,)‏ 
2.). وعالى الرغم من عدم وجود إجماع حول اممكان الذي b‏ منه علماء البيانات» إلا أن 
هناك فهمًا مشتركًا للمهارات والصفات المتوقع توافرها في ble‏ البيانات. ويوضح الشكل (۸-۸) 
رسمًا بيانيًا عالي المستوى لهذه المهارات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Vo!‏ 


الفصل الثامن 





البرمجة بر 
ls‏ هة الل 
n‏ 











شكل 6-8: المهارات التي تحدد عام البيانات 
فمن المُتوقع أن يكون لدى عام البيانات مهارات شخصية مثل الإبداع: والفضولء وتبادل 
المعلومات / العلاقات بين الأشخاصء والخبرات الخاصة بالمجال: وتعريف المشكلة؛ والإدارة (تظهر في 
أشكال سداسية خضراء الخلفية في أعلى الجانب الأيسر من الشكل) فضلًا عن مهارات فنية سليمة 
مثل معالجة البيانات» والبرمجة / القرصنة / البرمجة النصية» والإنترنت ووسائل التواصل الاجتماعي 
/ تقنيات الشبكات (تظهر في أشكال سداسية ذات خلفية رمادية أسفل يمين الشكل). وتدور رؤية 
فنية )١1-8(‏ حول الإعلان عن وظيفة نموذجية لعا البيانات. 
رؤية فنية ١-8‏ 
وظيفة نموذجية لعلماء البيانات 

تبحث [بعض الشركات] عن عام بيانات لينضم إلى فريق تحليلات البيانات الضخمة لدينا. 

ومن المتوقع أن يكون كل فرد في هذا الدور مستعدًا للعمل كمهندس برامج» وباحث كمي. 

وسوف يكون للمرشح المثالي اهتمام كبير في دراسة شبكة اجتماعية عبر الإنترنت وشغف 

لتحديد الأسئلة التي تساعدنا في تشكيل أفضل المنتجات بالإضافة إلى الإجابة عن هذه الأسئلة. 


Vor‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 








الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


المسؤوليات: 

- العمل عن كثب مع فريق هندسة المنتجات لتحديد الأسئلة المهمة عن المنتج 
والإجابة عليها. 

- الإجابة على الأسئلة المتعلقة بالمنتجات باستخدام الأساليب الإحصائية المناسبة 
على البيانات المتاحة. 

- نقل النتائج ممديري ومهندسي الإنتاج. 

- إدارة مجموعة البيانات الجديدة وتحسين مصادر البيانات الموجودة. 

- تحليل وتفسير نتائج تجارب المنتج. 

- تطوير أفضل الممارسات للأجهزة والتجريب ونقل ذلك إلى فرق هندسة المنتجات. 

المتطلبات: 

- الحصول على ماجستير أو دكتوراه في أحد المجالات الفنية ذات الصلة: أو أن يكون 
لديه أكثر من ع سنوات من الخبرة في دور له صلة بهذا المجال. 

- خبرة واسعة في حل المشكلات التحليلية باستخدام الأساليب الكمية. 


- التعاون في المعالجة البارعة وتحليل البيانات المعقدة ذات الحجم الكبير والبعد 
العالي من مصادر مختلفة. 


- وجود شغف قوي للبحث التجريبي والإجابة عن الأسئلة الصعبة باستخدام البيانات. 
- منهج تحليلي مرن يسمح للنتائج بمستويات متفاوتة من الدقة. 

- القدرة على توصيل التحليل الكمي ام معقد بطريقة واضحةء ودقيقةء وقابلة للتطبيق. 
- الطلاقة في استخدام لغة برمجة نصية واحدة على الأقل مثل ههطاتإ5 أو 5118. 

- الإلمام بقواعد البيانات العلائقية 1:9[ 50. 

- الخبرة المعرفية بأداة تحليل مثل 12 أو 2/113 أو 545. 

خبرة في العمل مع مجموعات كبيرة من البيانات: بالإضافة إلى الخبرة في العمل مع 


(è! Hive .-Hadoop .MapReduce) |I $265 أدوات الحوسبة الملقسمة‎ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


vor 


الفصل الثامن 


ونادرًا ما يكون هناك أشخاص يتمتعون بهذه المجموعة من المهارات» مما يفسر سبب النقص 

في عدد علماء البيانات. وبسبب زيادة الطلب على هذه الفئة من الأفراد الأقل نسبيًاه تكون 
رواتب البداية لعلماء البيانات أعلى بكثير من ستة أرقام (بالدولار الأمريي). أما الأشخاص الذين 
لديهم خبرة واسعة: بالإضافة إلى أنهم يملكون خبرة في مجال معينء فإن رواتبهم أعلى من ذلك 
بكثير. وفي معظم المنظمات. سيكون من الضروري بناء فريق من الأشخاص الذين لديهم هذه 
المهارات بشكل جماعي بدلا من البحث عن أفراد يتمتعون بهذه القدرات» وفيما يلي بعض 
التصريحات الحديثة حول علماء البيانات: 
- يقوم علماء البيانات بتحويل البيانات الضخمة إلى قيمة ضخمة: حيث يقدمون المنتجات التي 

تُرضي المستخدمين كما يُقدمون الأفكار التي تُخبر بقرارات الأعمال. 
- إن عاط البيانات ليس بارعًا في التعامل مع البيانات فحسب. بل إنه يُقدر أيضًا البيانات نفسها 

كأصل لا يُقدر بثمن. 
- بحلول عام ۲٠۲۰‏ سيكون هناك 6,0 مليون وظيفة جديدة لعلم البيانات» والتي لن يتم شَغْل 

سوى ثلثها فقط نظرًا لعدم توافر الأشخاص لشَّغْل هذه الوظائف. 
- علماء البيانات اليوم هم أساطير الأسواق امالية في الثمانينيات. 

إن استخدام علماء البيانات لا يقتصر على شركات الإنترنت ذات التقنية العالية. فالعديد 

من الشركات التي لا تمتلك الكثير من التواجد على الإنترنت هي أيضًا مهتمة بمتخصصي تحليلات 
البيانات الضخمة المؤهلين تأهيلًا عاليًا. وفي الواقع؛ فإن ذلك هو المجال الذي يشهد الكثير 
من النمو. وبالطبع: وكما لوحظ في الكتاب عدة مراتء فإن فرص تنظيم المشاريع لا تزال 
موجودة لتطوير التطبيق التالي «القاتل» والذي من شأنه أن يُحدث فرقًا كبيرًا لإحدى المنظمات 
والمستفيدين منها وبالتالي تجعلك غنيًا ومشهورًا. 


أسئلة مراجعة على القسم ۷-۸: 

Sade ما هو عاط البيانات؟ وما سبب زيادة الطلب‎ -١ 

-Y‏ ما هي الخصائص المشتركة لعلماء البيانات؟ وأي من هذه الخصائص يُعد أكثرها أهمية؟ 
-٣‏ من أين يأتي علماء البيانات؟ وما هي الخلفيات التعليمية التي لديهم؟ 

-٤‏ في رأيك» ما هو الطريق لكي Úle gua‏ عظيمًا في البيانات؟ 


vog‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


تلخيص لأهم نقاط الفصل: 

- تستطيع البيانات الجغرافية أن تعزز تطبيقات التحليلات عن طريق دمج معلومات المكان. 

- يمكن التنقيب في معلومات موقع المستخدمين الحالي لتطوير الحملات الترويجية التي تستهدف 
مستخدم معين في الوقت المناسب. 

- يمكن استخدام معلومات اللمكان من أجهزة الجوال لإنشاء ملفات تعريف لسلوك وحركة 
المستخدم. تمَكّن مثل هذه المعلومات الخاصة بمكان المستخدمين من إيجاد أناس آخرين ذوي 
اهتمامات ومعلنين متشابهين لتكييف عروضهم الترويجية. 

- تستطيع أيضًا التحليلات المبنية على المكان أن تفيد المستهلكين بشكل مباشر وليس الشركات 
فقط. ويتم تطوير تطبيقات الجوال لتمكين مثل هذه التطبيقات للتحليلات الابتكارية. 

- يعتبر إنترنت الأشياء (101) المنحنى الأساسي القادم لنمو علم التحليلات / البيانات. ويطلق 
عليه البعض أيضًا الإنترنت الصناعي. 

- تنمو تطبيقات (101) في كل صناعة بما في ذلك التطبيقات الطبية والتصنيع والطاقة والملاحة الجوية. 

- تعتبر إحدى الفئات الشائعة لتطبيقات (101) هى الصيانة التنبؤية لتخفيض وقت توقف 
المعدات غير الضروري وإجراء الضيانة / الإصلاخات اللطلوبة قبل استلزامها. 

- تقدم الحوسبة السحابية إمكانية استخدام البرمجيات والأجهزة والمنصات والبنية التحتية, JS‏ 
بحسب اشتراكه. كما تمكن الحوسبة السحابية المستخدم من استثمار أكثر قابلية للتطوير. 

- تقدم الخدمات التحليلية القائمة على الحوسبة السحابية إلى المنظمات أحدث التقنيات دون 
استثمار معنوي مسبق. 

- تستطيع التحليلات التأثير على المنظمات بطرق كثيرة. كأنظمة مستقلة أو متكاملة فيما بينهاء 
أو مع أنظمة معلومات أخرى قائمة على الحوسبة. 

- يتفاوت تأثير التحليلات على الأفراد. فقد يكون إيجابيًا أو محايدًا أو سلبيًا. 

- قد يصاحب تقديم أنظمة ذكية ظهور قضايا قانونية جديّة وتعتبر المسؤولية والخصوصية 
مجالي المشاكل المهيمنة. 

- يمكن توقع الكثير من الآثار الاجتماعية الإيجابية من التحليلات» والتي تتراوح من توفير فرص 
للمعاقين إلى قيادة الحرب ضد الإرهاب. ومن المحتمل تحسن جودة الحياة في كل من العمل 
والمنزل» كنتيجة للتحليلات. وبالطبع؛ يكون هناك أيضًا قضايا تحتاج للاهتمام. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري voo‏ 


الفصل الثامن 


- إن نمو التحليلات سوف يؤدي إلى تغيرات جوهرية في هيكل الصناعة ومستقبل التوظيف. 
- تكمن المعركة الكبرى حول من يمتلك جميع بيانات المستخدم التي يتم إنشاؤها من استعمال 
الهواتف الذكية والسيارات وما إلى ذلك. 


مصطلحات أساسية: 


الحوسبة السحابية | نظم المعلومات الجغرافية (GIS)‏ | إنثرنت الأشياء (161) 
(RFID) goll olasi isal‏ | الخصوصية 


أسئلة للمناقشة: 

-١‏ ما هي الفوائد المحتملة من استخدام البيانات الجغرافية المكانية في التحليلات؟ مع ضرب أمثلة. 

۲- ما هي أنواع التطبيقات الجديدة التي يمكن أن تظهر من معرفة المواقع الفورية للمستخدمين؟ 
وماذا لو كنت تعرف أيضًا ماذا يحملون في سلة تسوقهم مثلّا؟ 

AS -Y‏ يمكن أن يستفيد المستهلكون من استخدام التحليلات: لا سيما القائمة منها على معلومات المكان؟ 

-٤‏ ناقش العبارة التالية: «يعتبر إنشاء ملفات التعريف القائم على تتبع المكان قويًا ولكنه أيضًا 
يضع تهديدات للخصوصية». 

-٥‏ هل تعتبر الحوسبة السحابية «مجرد منتج قديم أعيد تغليفه بعبوة جديدة»؟ وكيف تتشابه 
مع المبادرات الأخرى؟ وكيف تختلف؟ 

-١‏ ناقش العلاقة بين أجهزة الجوال والشبكات الاجتماعية. 

- يذّعي البعض أن التحليلات بشكل عام تفرغ الأنشطة الإدارية من الإنسانية» ويعترض آخرون 
على هذا الادعاء. ناقش براهين كل من وجهتي النظر هاتين. 

8- إن تشخيص العدوى ووصف الأدوية هما نقاط ضعف العديد من الأطباء الممارسين (وفقًا ل 
E. H. Shortliffe‏ أحد مطوري 8150177). ولذا؛ يبدو أنه سيكون من الأفضل للمجتمع 
أن يتم استخدام أنظمة تشخيص مبنية على التحليلات من قبل المزيد من الأطباء. أجب عن 
الأسئلة التالية: 

-١‏ في رأيك اذا يتم استخدام مثل هذه الأنظمة بالحد الأدنى من قبل الأطباء؟ 


voi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 











الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


- افترض أنك مدير مستش فى ويتبع لك الأطباء الذين يتقاضون رواتبهم منها. ماذا ستفعل 
لإقناعهم باستخدام النظام؟ 
*- إذا كانت الفوائد المحتملة للمجتمع عظيمة جدًاء فهل يستطيع هذا المجتمع أن يفعل 
شيئًا يزيد من استخدام الأطباء لمثل هذه النظم التحليلية؟ 

5- اذكر بعض مخاوف الخصوصية الرئيسة المتعلقة باستخدام التحليلات على بيانات الجوال؟ 

-٠‏ اذكر حالات جديدة للتعديات على خصوصية المستخدم وتأثيراتها على علم البيانات كمهنة. 

تمارين: شبكة جامعة تيراداتا )10[N(‏ وغيرها من التمارين اليدوية: 

- اذهب إل teradatauniversitynetwork.com‏ وابحث عن دراسات الحالة. قم بمشاهدة 
فيديو 851 عن حالة الركاب الذين تم انقطاع الاتصال بهم والذين قد تكون رأيتهم أثناء قراءة 
الفصل الأول. ما هي التطبيقات الجديدة التي يمكنك تخيلها بمستوى البيانات التفصيلية التي 
يمكن لشركات الطيران التقاطها اليوم؟ 

.«eradatauniversitynetwork.com ye -‏ اذهب إلى مكتبة الحلقات الصوتية. 
قم بإيجاد حلقات صوتية عن ذكاء الأعمال واسعة الانتشار والمقدمة من -Hugh Watson‏ 
قم بتلخيص النقاط المعروضة من قبل المتحدث. 

- اذهب إل terdatauniversitynetwork.com‏ وابحث عن مقاطع فیدیو 851. استعرض 
هذه المقاطع وأجب عن أسئلة الحالة المرتبطة بها. 

- توفر المجموعات المبنية على تتبع المكان احتمال الخدمات الشخصية ولكن يتحدى الخصوصية. قم 
بتقسيم الصف إلى فريقين للتناظر أحدهما «مع» والآخر «ضد» هذه التطبيقات. 

- حدد القضايا الأخلاقية المرتبطة باتخاذ القرارات الإدارية. ابحث على الإنترنت» وانضم إلى مجموعات 
/ ا مدونات المناقشة» واقرأ المقالات من الإنترنتء ثم قم بإعداد تقرير عن النتائج الخاصة بك. 

- ابحث على الإنترنت لإيجاد أمثلة لكيفية قيام نظم التحليلات بتسهيل أنشطة مثل التفويضء 
والتخصيص الشاملء والعمل الجماعي. 

- ابحث في مركز موارد التقنية الخاص بجمعية 85 الأمريكية abanet.org/tech/Itrc/techethics.)‏ 
.nolo.com gs9 (html‏ ما هي الاهتمامات القانونية وا مجتمعية الرئيسة والمتقدمة التي تمت 
معالجتها هناك؟ وكيف يتم التعامل معها؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vov‏ 


الفصل الثامن 


- قم باستكشاف عدة مواقع مرتبطة بالرعاية الصحية (مثل «زمء.1166112 وكصن.مط). أوجد 
القضايا المتعلقة بالتحليلات والخصوصية: ثم اكتب تقريرًا عن الكيفية التي تعمل بها هذه 
المواقع على تحسين الرعاية الصحية. 

- قم بزيارةö‏ 35 Matt Turck ةصlëllا IoT Ecosystem à‏ على http://mattturck.‏ 
JSVI e 47. .com/2016/03/28/2016-iot-landscape/‏ شرکتین فیما لا يقل عن قطاعين 
رأسيين وقطاعين أفقيين. اذهب إلى مواقع الويب الخاصة بهاتين الشركتين وقم بإعداد تقرير 
عن عروضهما ونجاحات العملاء. 

- ادخل على YouTube.com‏ وابحث عن مقاطع فيديو عن الحوسبة السحابية: وقم بمشاهدة 
اثنين على الأقل من هذه المقاطع. لخَّص النتائج الخاصّة بك. 

- ادخل على 231003.60173 واكتشف كيف تستطيع إنشاء ومشاركة موسيقى مع الأصدقاء. 
استكشف كيف يحلل الموقع تفضيلات المستخدم. 

- ادخل على 1111111310726.6012 واستعرض دراسات حالة متنوعة وقم بتلخيص أحد التطبيقات 
المثيرة من أجهزة الاستشعار في فهم التبادلات الاجتماعية في المنظمات. 

- يعد الهدف من هذا التمرين هو تعريفك بإمكانيات الهواتف الذكية لتحديد النشاط البشري. 
وتكون مجموعة البيانات متاحة على: ؟تاعخ+ صفصنة1/واء5ة02 /لتصاسلء. ناولع تطعية 
ity-Recognition--Using« Smartphones‏ 

- إنها تحتوي على قراءات التسارع وضابط الاتجاهات (البوصلة الدوارة) لثلاثين فردًا يضعون 
الهاتف الذي في حزام يلتف حول وسطهم. تكون البيانات متاحة في صورتها الخام وتتضمن 
بعض جهود تجهيز البيانات» ويكون هدفك هو تحديد وتصنيف هذه القراءات إلى أنشطة. 
كالمشي والجري وتسلق الجبال؛ وما إلى ذلك. ويتوفر المزيد من المعلومات عن مجموعة 
البيانات في صفحة التنزيل. ويمكنك استخدام التجميع من أجل الاستكشاف المبدئي واكتساب 
فهم البيانات. كما يمكنك استخدام أدوات مثل +1 لتجهيز وتحليل هذه البيانات. 


VON‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


المراجع: 

- Alteryx.com. (n.d.). Great Clips.alteryx.com/sites/default/files/resources/files/case-study-great-chips. 
pdf (accessed August 2016). 

- Argyris, C. (1971). Management information systems: The challenge to rationality and emotionality. 
Management Science, 17(6), B-275. 

- Autor, D. H. (2016). The shifts—great and small—in workplace automation. sloanreview.mit.edu/ 
article/the-shifts-great-and-small-in-workplace-automation/(accessed August 2016). 

- Blogs.ESRI.com. (2014). From customers to CxOs, Starbucks delivers world-class service. blogs.esri. 
comy/esri/ucinsider/2014/07/29/Starbucks/(accessed August 2016). 

- Blogs.microsoft.com (2015). Dartmouth-Hitchcock ushers in a new age of proactive, personalized healthcare 
using Cortana Analytics Suite. microsoft.com/transform/2015/07/13/dartmouth-hitchcock-ushers-in-a- 
new-age-of-proactive-personalized-healthcare-using-cortana-analytics-suite/(accessed August 2016). 

- Blogs.pb.com. (2015). The industrial Internet, Pitney Bowes and GE.blogs.pb.com/corporate/2015/07/14/ 
the- industrial-internet-pitney-bowes-and-ge/(accessed August 2016). 

- Blogs.technet.microsoft.com (2015). ML predicts school dropout risk & boosts graduation rates. 
blogs.technet.microsoft.com/machinelearning/2015/06/04/ml-predicts-school-dropout-risk-boosts- 
graduation-rates/(accessed August 2016). 

- Brynjolfsson, E., & McAfee, A. (2016). The second machine age. secondmachineage.com (accessed September 2016). 

- Chae, B., Paradice, D. B., Courtney, J. F., & Cagle, C. F. (2005). Incorporating an ethical perspective into 
problem formulation. Decision Support Systems, 40(2), 197-212. 

- CIO.in. (2015). Mankind Pharma finds an antidote in IBM solution for improving app implementation 
time. cio.in/solution-center/emc/55281 (accessed August 2016). 

- Collins, J. (2005, June). Sysco gets fresh with RFID. RFID Journal. rfidjournal.com/articles/view?1652 
(accessed September 2016). 

- ComputerWeekly.com. (2016). Big-data and open source cloud technology help Gulf Air pin down 
customer sentiment. computerweekly.com/news/450297404/Big-data-and-open-source-cloud- 
technology-help-Gulf-Air- pin-down-customer-sentiment (accessed August 2016). 

- Customers.microsoft.com (2015). Rockwell Automation: Fueling the oil and gas industry with IoT 
customers. microsoft.com/Pages/CustomerStory.aspx?recid-19922 (accessed August 2016). 

- Customers.microsoft.com (2015). Tacoma Public Schools: Predicting student dropout risks, increasing graduation 
rates with cloud analytics. customers.microsoft.com/Pages/CustomerStory.aspx?recid-20703 (accessed August 2016). 

- CxOtoday.com (2014). Cloud platform to help Pharma Co accelerate growth. cxotoday.com/story/ 
mankind-pharmato-drive-growth-with-softlayers-cloud-platform (accessed August 2016). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vos‏ 


الفصل الثامن 


- Davenport, T. H., & Harris, J. G. (2005). Automated decision making comes of age. MIT Sloan 
Management Review, 46(4), 83. 

- Davenport, T. H., & Patil, D. J. (2012, October). Data scientist. Harvard Business Review, 70-76. 

- Delen, D., Hardgrave, B., & Sharda, R. (2007). RFID for better supply-chain management through 
enhanced information visibility. Production and Operations Management, 16(5) 613-624. 

- Delen, D., Hardgrave, B. C., & Sharda, R. (2011, April). The promise of RFID-based sensors in the 
perishables supply chain. IEEE Wireless Communications, 1-8. 

- Demirkan, H., & Delen, D. (2013, April). Leveraging the capabilities of service-oriented decision 
support systems: Putting analytics and Big Data in cloud. Decision Support Systems, 55(1), 412-421. 
dx.doi.org/10.1016/j.dss.2012.05.048 (accessed September 2016). 

- Digit.HBS.org (2015). Starbucks :Brewing up a data storm! digit.hbs.org/submission/ Starbucks 
-brewing-up-a-data-storm/(accessed August 2016). 

- Ekster, G. (2015). Driving investment performance with alternative data. integrity-research.com/wp-content/ 
uploads/2015/11/Driving-Investment-Performance-With-Alternative-Data.pdf (accessed September 2016). 

- Electronic Privacy Information Center (2005). USA PATRIOT Act. epic.org/privacy/terrorism/ 
usapatriot (accessed September 2016). 

- Elson, R. J., & LeClerc, R. (2005). Security and privacy concerns in the data warehouse environment. 
Business Intelligence Journal, 10(3), 51. 

- Enterprise.microsoft.com. (2015). How Dartmouth-Hitchcock is challenging healthcare's status quo 
with Cortana Analytics. enterprise.microsoft.com/en-us/industries/health/how-dartmouth-hitchcock- 
is-challenging-healthcares-status-quo-with-cortana-analytics/(accessed August 2016). 

- Gartner.com (2016) Gartner Says Worldwide Public Cloud Services Market Is Forecast to Reach $204 
billion in 2016. http://www.gartner.com/newsroom/id/3188817 (Accessed November 2016). 

- GE.com (2016). Making machines intelligent is smart business.ge.com/digital/sites/default/files/ge - 
digital predix pb brochure.pdf (accessed August 2016). 

- GEreports.com (2016). The power of Predix: An inside look at how Pitney Bowes is using the industrial 
Internet. platform.gereports.com/the-power-of-predix-an-inside-look-at-how-pitney-bowes-has-been- 
using-the-industrial-internet-platform (accessed August 2016). 

- Gnau, S. (2010). Find your edge. Teradata Magazine Special Edition Location Intelligence. teradata.com/articles/ 
Teradata-Magazine-Special-Edition-Location-Intelligence-AR6270/?type-ART (accessed September 2016). 

- Goel, V. (2014, June 29). Facebook tinkers with users' emotions in news feed experiment, stirring 
outcry. New York Times. nytimes.com/2014/06/30/technology/facebook-tinkers-with-users-emotions- 


in-news-feed-experiment-stirring-outcry.html (accessed September 2016). 


ve‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


- Hardgrave, B. C., Langford, S., Waller, M., & Miller, R. (2008). Measuring the impact of RFID on out 
of stocks at Wal-Mart. MIS Quarterly Executive, 7(4), 181-192. 

- IBMBigdatahub.com (2015). SilverHook Powerboats: Tracking fast-moving boats in real time. http://www.ibm- 
Bigdatahub.com/blog/silverhook-powerboats-tracking-fast-moving-powerboats-real-time (accessed August 2016). 

- IBM.com (2015). Case study: SilverHook Powerboats develops a racing app 40 percent faster. ibm.com/ 
cloud-computing/case-studies/silverhook-powerboats.html (accessed August 2016). 

- IBM.com (2014). Softlayer hosting platform reduces application implementation time by 98 percent. www- 
03.ibm.com/software/businesscasestudies/us/en/corp?synkey-Y979749150926G25 (accessed August 2016). 

- IBM.com (2015). Smarter care at MD Anderson. www-03.ibm.com/software/businesscasestudies/us/ 
en/corp? synkey-H447240066679238 (accessed August 2016). 

- Juniper Research (2016). ‘Internet of Things' connected devices to almost triple to over 38 billion units 
by 2020. http://www.juniperresearch.com/press/press-releases/iot-connected-devices-to-triple-to-38- 
bn-by-2020 (accessed September 2016). 

- Kalakota, R. (2011). Analytics-as-a-service: Understanding how Amazon.com is changing the rules. 
practicalanalytics. wordpress.com/201 1/08/13/analytics-as-a-service-understanding-how-amazon- 
com-is-changing-the-rules (accessed September 2016). 

- Katz, J. (2006, February). Reaching for ROI on RFID. Industry Week. industryweek.com/companies- 
amp-executives/reaching-roi-rfid (accessed September 2016). 

- Krivda, C. D. (2010). Pinpoint opportunity. Teradata Magazine Special Edition Location Intelligence. 
teradata.com/articles/Teradata-Magazine-Special-Edition-Location-Intelligence-AR6270/?type-ART 
(accessed September 2016). 

- Mankindpharma.com. (n.d.). Overview. mankindpharma.com/company/companyoverview (accessed 
August 2016). 

- Mason, R. O., Mason, F. M., & Culnan, M. J. (1995). Ethics of information management. Thousand 
Oaks, CA: Sage. 

- McKendrick, J. (2015). SilverHook Powerboats: Tracking fast-moving boats in real time. ibmBigdatahub. 
com/blog/silverhook-powerboats-tracking-fast-moving-power-boats-real-time (accessed August 2016). 

- McKinsey.com (2015). An executives guide to the Internet of Things. mckinsey.com/business-functions/ 
business-technology/our-insights/an-executives-guide-to-the-internet-of-things (accessed September 2016). 

- MDanderson.org (2013). MD Anderson taps IBM Watson to power Moon Shots mission. mdanderson.org/ 
news-room/2013/10/md-anderson-ibm-watson-work-together-to-fight-cancer.html (accessed August 2016). 

- Microsoft.com (n.d.). Customer stories | Rockwell Automation. microsoft.com/en-us/cloud-platform/ 


customer-stories-rock-well-automation (accessed July 2016). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vw‏ 


الفصل الثامن 


- Mintzberg, H., Lampel, J. B., Quinn, J. B., & Ghoshel, S. (2002). The strategy process, 4th ed. Upper 
Saddle River, NJ: Prentice Hall. 

- Mobilemarketer.com (2013). Quiznos sees 20pc boost in coupon redemption via location-based mobile ad 
campaign. mobilemarketer.com/cms/news/advertising/14738.html (accessed September 2016). 

- Moradpour, S., & Bhuptani, M. (2005). RFID field guide: Deploying radio frequency identification 
systems. New York: Sun Microsystems Press. 

- News.pb.com (2015). GE and Pitney Bowes join forces to bring the power of the industrial Internet to 
the world of commerce.news.pb.com/article display.cfm?article id—5634 (accessed August 2016). 

- O'Neil, C. (2016). Weapons of Math Destruction: How Big Data Increases Inequality and Threatens 
Democracy, Crown, 2016 New York. 

- Perez-Cascante, L. P, Plaisent, M., Maguiraga, L., & Bernard, P. (2002). The impact of expert decision support 
systems on the performance of new employees. Information Resources Management Journal 15(4), 64-78. 

- Peslak, A. R. (2005). Internet privacy policies: A review and survey of the Fortune 50. Information 
Resources Management Journal, 18(1), 29-41. 

- Ransbotham, S. (2016). How will cognitive technologies affect your organization? sloanreview.mit.edu/ 
article/how-will-cognitive-technologies-affect-your-organization/(accessed September 2016). 

- RedHat.com (2016). Gulf Air builds private cloud for Big data innovation with Red Hat Technologies. 
redhat.com/en/about/press-releases/gulf-air-builds-private-cloud-Big-data-innovation-red-hat- 
technologies (accessed August 2016). 

- RedHat.com (2016). Gulf Air's Big Data innovation delivers deeper customer insight. redhat.com/en/ 
success-stories (accessed August 2016). 

- Sahin, E., Babai, M. A., Dallery, Y., & Vaillant, R. (2007). Ensuring supply chain safety through time 
temperature integrators. The International Journal of Logistics Management, 18(1), 102-124. 

- Snowflake.net (n.d.). Chime delivers personalized customer experience using Chime. snowflake.net/ 
product (accessed August 2016). 

- Standage, T. (2016). Special report by The Economist: The return of the machinery question. bit. 
ly/28X8cfD, economist.com/news/special-report/21700761-after-many-false-starts-artificial-intelligence- 
has-taken-will-it-cause-mass (accessed September 2016). 

- Stein, J. (2011). Data mining: How companies now know everything about you. Time. time.com/time/ 
magazine/article/0,9171,2058205,00.html (accessed September 2016). 

- Swedberg, C. (2006a, October). Samworth keeps cool with RFID. RFID Journal. rfidjournal.com/ 
article/articleview/2733/(accessed September 2016). 

- Swedberg, C. (2006b, December). Starbucks keeps fresh with RFID. RFID Journal. rfidjournal.com/ 
article/articleview/2890/(accessed September 2016). 


vw‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


- TheGuardian.com (2013). John Snow's data journalism: The cholera map that changed the world. 
theguardian.com/news/datablog/2013/mar/15/john-snow-cholera-map (accessed August 2016). 


- Turck, M. (2016). Internet of Things: Are we there yet? (Ihe 2016 IoT landscape). mattturck. 
com/2016/03/28/2016-iot-landscape/(accessed August 2016). 


- WallStreetJournal.com (2016). What they know.wsj.com/public/page/what-they-know-digital-privacy. 
html (accessed September 2016). 


- Welch, D. (2016, July 18-24). The battle for smart car data. Bloomberg Business Week. bloomberg. 
com/news/articles/2016-07-12/your-car-s-been-studying-you-closely-and-everyone-wants-the-data 
(accessed September 2016). 


- Wheeler, C. (2014). Going Big with GIS. esri.com/esri-news/arcwatch/0814/going-Big-with-gis 
(accessed August 2016). 


- Wikipedia.org (n.d.). Cloud computing. en.wikipedia.org/wiki/cloud computing (accessed August 2016). 
- Wikipedia.org (n.d.). Mankind Pharma. wikipedia.org/wiki/Mankind Pharma (accessed August 2016). 


- Wikipedia.org (n.d.). University of Texas MD Anderson Cancer Center. wikipedia.org/wiki/University - 
of Texas MD Anderson Cancer Center (accessed August 2016). 


- Winter, R. (2008). E-Bayturnstoanalyticsasaservice.information-  week.com/news/software/info 
management/210800736 (accessed September 2016). 


- YouTube.com (2014). Smarter care at MD Anderson. youtube.com/watch?v-savJ8VQOKcA (accessed 
August 2016). 


- YouTube.com. (2015). Dartmouth-Hitchcock revolutionizes the U.S. healthcare system. youtube.com/ 
watch?v--wVeHZNn8aU (accessed August 2016). 


- YouTube.com (2016). The saving power of data. youtube.com/watch?v-rfAoKs8XxzY (accessed August 2016). 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vr‏ 


المترجم في سطور 
د. محمد بن عايض بن ظافر القرني. 
المؤهل العلمي: 


دكتوراه في علم ال معلومات» تقنية المعلومات. جامعة شمال تكساسء تكساسء 
الولايات المتحدة الأمريكية. 


العمل الحالي: 
مدير عام مركز المعلومات والوثائق» معهد الإدارة العامة الرياضء المملكة العربية السعودية. 


أبرز الخبرات العلمية: 

- Alshare, K.A., Moqbel, M. and Algarni, M.A. (2019) The impact of trust, security, 
and privacy on individual's use of the internet for online shopping and social media: 
a multi-cultural study, Int. J. Mobile Communications,17(5), (513-536). 

- Algarni M., Khairi, A. (2017) Open Access and Digital Repositories (Arabic 
and African Repositories) Comparative Study. Journal of the Saudi Library and 
Information association, 1, 489-510. 

- Algarni, M., Musa, A., & Alshare, K. (2015). Readiness to reveal personal information 
on social media: A Cross-cultural analysis of Nigeria, United States, Saudi Arabia, 
and Qatar, in proceedings of the DSI, Houston, Texas. 

- Alshare, K., Algarni, M., Musa, A. (2015). Readiness to reveal personal information 
on social media: A Cross-cultural analysis of Nigeria, United States, Saudi Arabia, 
and Qatar, in proceedings of the Southwest Decision Sciences Institute, Houston, TX. 

- Algarni, M., Baron, B.K., Hooks, D., Wada, A., & Wade, R.L. (2013). Using social 
network analysis (SNA) to enhance learning: A community engagement approach. 
iConference 2013 Proceedings of UNT. 

- Algarni, M. (2010). Look! Libraries without Public Access Catalogue: The potentialities 
of GPS + RFID technologies in Academic Libraries, CULS conference, Emporia, KS. 


vie‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


- Dow, M., Algarni, M., Summey, T., Valenti, S., Ibrahim, A., Polepeddi, P., & Hallett, 
D. (2012). Infoliteracy&adistance: Creating Opportunities to Reach (Instruct) 
Distance Students, Journal of Library & Information Services in Distance Learning, 


6(3-4), Memphis, Tennessee. 


- Algarni, M., Musa, A., & Alshare, K. (2010). A Conceptual Framework For Factors 
That Influence Information Utilization By Project Teams: A Human Information 


Behavior Approach, in proceedings of the DSI, San Diego, California. 

أبرز الخبرات العملية: 

١م‏ - حتى الآن: مدير عام مركز المعلومات والوثائق» معهد الإدارة العامة الرياضء المملكة 
العربية السعودية. 

© مم - حتى الآن: رئيس فريق بناء وتصميم نظام ا متابعة الإلكتروني» معهد الإدارة العامة, 
الرياضء المملكة العربية السعودية. 

eY M e‏ - حتى الآن: عضو اللجنة الدائمة الرئيسية لبرنامج التحول الوطني (التدريب عن بُعدء إثرائي»» 
معهد الإدارة العامة. الرياضء المملكة العربية السعودية. 

« 19١"م‏ - حتى الآن: رئيس اللجنة الدائمة للمتابعة والتوثيق لبرنامج التحول الوطني (التدريب 
عن بُعدء إثرائي)» معهد الإدارة العامة» الرياض الممملكة العربية السعودية. 

« مم - حتى الآن: رئيس الفريق المعلوماتي لبناء وتصميم نظام ذكاء الأعمال والتحليلات ولوحات 
امعلوماتية الذكيةء مركز المعلومات» معهد الإدارة العامة الرياض» المملكة العربية السعودية. 

al els eame tp VA e‏ برنامج تدريبي موجه للتنفيذيين (ذكاء الأعمال ودعم القرار)» معهد 
الإدارة العامة» الرياض» المملكة العربية السعودية. 

V e‏ :: تصميم وإعداد حلقة تطبيقية للقيادات (ذكاء الأعمال وصناعة القرار)» معهد الإدارة 
العامةء الرياضء المملكة العربية السعودية. 

١‏ - ۹١۲م:‏ رئيس فريق الخدمات الاستشارية لدراسات اللجنة الوزارية للتنظيم الإداري 
(الملغاة). معهد الإدارة العامة الرياضء ال مملكة العربية السعودية. 

١1-٠‏ م: مدير عام مركز التوثيق الإداري» معهد الإدارة العامةء elo JI‏ ا مملكة العربية السعودية. 

۰ ۲۰۱۲ - 6١۲م:‏ رئيس قسم ال معلومات وكبير الاستشاريين» الشركة الأمريكية للصحة العضوية - 
دوام كامل» دالاس» الولايات المتحدة الأمريكية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vio‏ 


مراجع الترجمة في سطور 


د. حمود بن ظافر الدوسري. 


المؤهل العلمي: 

- دكتوراه في علوم الحاسب من جامعة كاردف بالمملكة المتحدة, أكتوبر ١1٠لام.‏ 

العمل الحالى: 

iid elis 8b -‏ نظم المعلومات بكلية علوم الحاسب وا معلوماتء جامعة الملك سعود. 


أبرز الخبرات العلمية: 

- Hessah Alsaif, Hmood Al-Dossari. Detecting and Classifying Crimes from Arabic 

Twitter Posts using Text Mining Techniques. In the International Journal of Advanced 
Computer Science and Applications (IJACSA) - Volume 9 No 10, October 2018. 

- Shamsul Huda, Kevin Liu, Mohamed Abdelrazek, Amani Ibrahim, Sultan Alyahya, 

Hmood Al-Dossari, and Shafiq Ahmad. An ensemble oversampling model for class 


imbalance problem in software defect prediction. In IEEE Access, Volume 6, March 
2018 (ISI-indexed Journal) 


Shamsul Huda, Sultan Alyahya, Md Mohsin Ali, Shafiq Ahmad, Jemal Abawajy, 


Hmood Al-Dossari, and John Yearwood. A Framework for Software Defect 
Prediction and Metric Selection. In IEEE Access, Volume 6, December 2017 (ISI- 
indexed Journal) 5. Hailah Al-Ballaa, Hmood Al-Dossari, Abdulrahman Mirza. 
Research area classification using Wikipedia and information retrieval. Proceedings 
of the 1st International Conference on Internet of Things and Machine Learning, 


ACM Page 49 - 51, October 2017 


Mohammad Mehedi Hassan, Hanouf Saad Albakr, Hmood Al-Dossari, and Amr 
Mohamed. Resource Provisioning for Cloud-Assisted Body Area Network in a Smart 


Home Environment. In IEEE Access, Volume 5, July 2017 (ISI-indexed Journal). 


vn‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


- H. Al-Dossari, J. Shao, A. Preece. QoS Assessment over Multiple Attributes. In IEEE 
10th International Conference on Computer and Information Technology (CIT2010), 
pp 1456-1461. IEEE, 2010. 37. H. Al-Dossari, A. Preece, J. Shao. Improving QoS 
Assessment Involving Multiple Attributes. In 26th British National Conference on 


Databases PhD Forum (BNCOD 2009). Birmingham, 2009.‏ 
أبرز الخبرات العملية: 
١‏ ۲۷م - حتى الآن: أستاذ مشارك في قسم نظم المعلومات بكلية علوم الحاسب والمعلومات 
في جامعة الملك سعود. 
o‏ 018-6"م: رئيس قسم نظم المعلومات بكلية علوم الحاسب والمعلومات في جامعة الملك سعود. 
0 أستاذ مساعد في قسم نظم المعلومات بكلية علوم الحاسب والمعلومات في جامعة الملك سعود. 
٠7018-7م:‏ مدير شعبة الحاسب الآلي في قسم مهارات تظوير الذات بعمادة السنة 
التحضيرية في جامعة املك سعود. 
۰ -؟1١ام:‏ رئيس قسم اللغة الإنجليزية بكلية المعلمين بجامعة الملك سعود. 
۰ - ١١۲م:‏ أستاذ مساعد بقسم الحاسب الآلي بكلية المعلمين في جامعة الملك سعود. 
pao VeV- Yer o‏ المدرسة السعودية بكادرف في ا مملكة المتحدة. 
PYN- Yero ٠‏ محاضر بقسم الحاسب الآلي بكلية ال معلمين في جامعة الملك سعود. 
٠0 - 6601 «‏ ٠لام:‏ معيد بقسم الحاسب الآلي بكلية ا معلمين» وزارة التربية والتعليم. 
١‏ -١٠۲م:‏ معيد بكلية املك فيصل الجويةء وزارة الدفاع والطيران. 
te 1888 - ١‏ مبرمج على المرتبة السابعة في وكالة الضمان الاجتماعي بوزارة العمل والشؤون الاجتماعية. 
« عضو البرنامج الوطني للتحول في التعاملات الإلكترونية الحكومية يسر. 
« مستشار غير متفرغ في الهيئة العليا لتطوير مدينة الرياض. 
© رئيس لجنة إدارة الجودة بقسم الحاسب الآلي بكلية ا معلمين في جامعة املك سعود. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vw‏ 


حقوق الطبع والنشر محفوظة لمعهد الإدارة العامة ولا يجوز 


اقتباس جزء من هذا الكتاب أو إعادة طبعه بأية صورة دون 


موافقة كتابية من المعهد إلا في حالات الاقتباس القصير بغرض 
النقد والتحليل» مع وجوب ذكر المصدر. 





تم التصميم والإخراج الفني والطباعة في 


الإدارة العامة للطباعة والنشر - معهد الإدارة العامة ١٤٤١ه‏ 





هذا الكتاب: 

تطوّر مصطلح التحليلات إلى مصطلحات حديثة أخرىء مثل علم البيانات». وهو 
EE CO NEE EEE OE EC OE ORE‏ 
عامة - بإنشاء وحدات تنظيمية جديدة تركّز على التحليلات التي تدعم صُناع القرار 
معلوماتيًا ونسهم في رفع كفاءة وفعالية عملياتها؛ وذلك بالاعتماد على أحدث الأدوات 
المعلوماتية الذكية. مثل ذكاء الأعمالء والذي يستخلصٌ المعلومات بطريقة مبتكرة من 
تيارات البيانات المتنوعة. 

يُقَدّم هذا الكتاب منظوراً إداريًا لتحليلات الأعمال في ثمانية فصولء تبدأ بنظرة عامة 
على ذكاء الأعمالء والتحليلات. وعلم البيانات. ثم ينتقل إلى التحليلات الوصفية وتتضمّن 
طبيعة البيانات. والنمذجة الإحصائية. وتصوير البيانات. وذكاء الأعمال. ومستودعات 
البيانات ومصطلحات حديثة. مثل: بحيرات البيانات. متبوعة بالتحليلات التنبؤية وتتضمّن 
عملية وطرق وخوارزميات التنقيب في البيانات. وتحليلات النص والويب ووسائل التواصل 
الاجتماعي» ويليه ا التحليلات التوجيهيةء مثل الأمثلية والمجاكاق ثم استعراض المفاهيم 
والأدوات الأساسية للبياظلاتك الضخمكة, وينتهى الكتاث#انالتع رف كلاق الاتجاهات المستقبلية 
والخصوصية والاعتبارات_الإدارية في التحليلات. ` 





ختاما؛ فإِنّ هذا الكتاب LULA Css Xs‏ للأكادميين والمهنيين عان كافثة 
ا ا EE‏ ل ل ات د لك 
المنقحة من هذا الكتاب بالشمولية والوضوح وسهولة الاستخدام وتقديم مواد دقيقة 
ومُحدَّثة غير متوفرة في أيّ نص آخر؛ إضافةً للشرح التفصياي المُعرّز بحالات وأمثلة من 
عام الواقع؛ مثل أفضل الممارسات لتوظيف الأفراد الأذكياء للأدوات المعلوماتية لتحسين 
الأداء والعلاقات في منظمات الأعمال والحكومات والمنظمات غير الرّبحية؛ مما ارتقى 
ا EE‏ المعلوماتي للعمل الإداري؛ وبشكلٍ أساسي صُنع القرار. 


5 


مامالا 


تصميم وإخراج وطباعة الإدارة العامة للطباعة والنشر ‏ معهد الإدارة العامة ١54اه‏